学了SEO之后,经常会想到,搜索引擎是如何判断我们的文章是否原创的?怎样才能知道我们的产品是否具有高品质或低品质?怎样才能知道我的文章是否存在关键字堆积?怎样才能知道文章中的关键词密度。这种隐式语义索引原则正是目前主流搜索引擎使用的核心索引原则。其基本原理是基于中文分词。在前几节课中,我们详细介绍了中文分词原则。
汉语分词原则是说,搜索引擎如果要通过上万亿页来判断某一个关键词的排名,并计算其排名,那就很难了。这是不可能的,我们可以在零点-0秒的时间里计算出结果。而汉语词汇总数仅为8万。语义性索引,将上万亿页的网页分成八万条词条,这让计算变得非常简单。使计算从一个非常复杂的.非常巨大的数字转变成计算机可人为控制的数,仅此而已。
搜索蜘蛛将一页内的代码.全部下载后,就可以对它进行分析。将本页内所有的中文单词分类并加以剪裁。这种分割的过程就是分词,将页面中的内容分割成许多不能再分割的单词。那就去掉一些路标。何谓路标?一个.那个...…等等,这些关键字都是没有意义的。剩下一些名词.动词.形容词。
在将一页分成以下几个单词之后,开始计算每个单词出现的次数和频率。所以搜索引擎知道你的关键字在页面上出现了好几遍,还说出了关键词密度。
3.关键字的堆积。
搜索知道你的关键字在网页上出现了好几次,而且还知道与它相关的单词在网页上再次出现。例如,你一个单词出现了100次,与之相关的单词只出现两次,搜索引擎就知道你一定是在堆关键词,是在欺骗。那么说,是否有关键字堆起来,这是可以计算的。并且不同行业的词语不同,其比率也不相同。这样可以解决关键字堆砌问题。
4.相关关键字。
关键字其比值究竟是多少?比方说在广州网站建设中,“网站建设”出现次数,以及“广州网站建设”出现次数,他们的比例是多少。例如对外贸易网站建设、“外贸”出现次数、“外贸网站建设”出现次数、他们所占比例又是多少。这一家人也能找到答案。
您将一个关键字插入一篇无关的文章。例如网站上根本没讲的网站建设,你就插上“网站建设”。此时,“网站建设”可能会起到反作用。由于这是根据隐含索引的原则,你的关键字与你的网页无关。
5.原创问题。
搜索能否识别假原创?这很容易辨认。由于根据语义指标原则,它知道每个单词的比值。你们换个姿势,会不会有频率不同?频次相同,各位!只是说你添加一些单词还减去了一些单词,频率会有一定的变化,但变化不会太大。换位可以,但近义词是唯一的。并且换近义词之后,关键字就不再是这个单词。多篇文章合并起来也可以,但你这类文章是否可读?不能阅读。
也许有人会问,老师既然如此,我的伪原创文章为什么还是要收录呢。该如何解释呢?隐式语义索引原则,搜索引擎使用这一方法对其进行标识,但无法100%识别。说实在的,这是一个计算过程。这只蜘蛛是个程序。但是这个技术问题是可以实现的。你们要相信,总有一天,他能做到几乎100%可辨认。你们懂吗因此,有时,你不要总想着这样做。只要有一天他接近90%,我可以说,现在那些在网上做垃圾站的人,迟早都会被淘汰。*终,肯定是用户体验*好的那个网站获胜。认同感?由于搜索引擎中有资金,而且全球*优秀的工程师,搜索引擎的发展变化非常迅速。一个能带给用户*好体验的网站和网站,绝对能笑到*后,他一定是这样。
利用隐含语义原则的搜索引擎原则,但这需要程序来实现,这一过程需要多长时间,应该在2~3年后,才能达到90%。90%是个非常大的数字,目前估计只有40%-50%左右。如今的许多站长,已经越来越难了,收录一直在浮动。而且为何很多老站的收录都很稳定?它究竟是怎么回事?因此,对隐式语义索引原则的认识度在不断提高。许多长尾关键字,今天收录,明天删除,是这样吗?
6.内容重复的问题。
隐式语义索引原则,能让大家的网站,重复性高,收录越来越少。假如您是收集资料,您的收录只会越来越少。存在两种解决方法。
首先,加大重量。
例如有两个网站,我的权重比你高。你们先发制人,我收集你们。由于重量大,蜘蛛先向我爬。或先爬到你,但没有立刻收录,然后爬到我,收录。百度认为谁是原创的?跟每个人说,如果我比你重。百度会把我的文章当作原创。怎么了?由于迄今为止,百度判断原创还是主要靠权值。如果你比我早来几天要不然只要你一发我就收集了你,百度肯定会认为我是原创的。你们一定无法超越我。一发就收录了,排名还不错。只有慢慢累积权重,你才能提高排名,没有别的办法。
其次,我们不去采集,而是100%原创的内容。
在高权值的网站上收集并不重要。由于不能总是这么简单,一次采集就完成了。假如你先把自己的内容做的很好,如果你是个新站,请问谁会来收集你?只要你更新很及时并且网站有排名,会收集你。您同意吗?若您一开始就做完内页,那么所有内容都是原创。其他人不能收集你。起初是不收集的,后来再收集也没有用。根据我所说的逐步提升重量。现在的SEOWHY,有没有人去收集他呢?有的,但根本没用。
并不推荐进行任何防收集设置,这会影响用户体验。比如,禁止用户使用右键,或某些防收集代码,都会影响到你的收录和整个网站的优化。不要做任何防收集的东西。
7.隐含语义索引原则的引申思考。
对于隐语义索引的原理,我们可以考虑两个问题。
1.保持网页上关键字的*新相关性。
在不同时期,一个关键字的相关关键词是不同的。为了让网页上的关键字始终保持与网页内容相关的*新内容。所以搜索引擎会一直认为我们这个网站是有价值的。
2.研究那些外部链接较少、关键字较高的网页。这几页,说明百度对他的内容质量是很高的。
请立即点击咨询我们或拨打咨询热线: 1823-7777-110,我们会详细为你一一解答你心中的疑难。项目经理在线