营销知识
您的位置:主页 > 营销知识 >

隐含语义索引工作原理

网站编辑:红莲 │ 发表时间:2012-03-14 17:18 | 文章标签:隐含语义索引

LSI(Latent Semantic Index)翻译成中文的意思就是隐含语义索引。

隐含语义索引工作原理: .

当蜘蛛爬取并下载站点页面后,隐藏语义索引(以下我们检查LSI)把下载网页的所有单词制作成一个列表,然后就是将一些没有语义的单词过滤(比如停用词,过滤词等),然后再将站点所有的页面都做出单词列表。然后利用这些列表就可以做一个以页面(文档)为X轴,单词为Y轴的巨型矩阵。如果一个单词出现在某个页面,那么对于的页面位置我们标为1,反之就为0。这样就可以很清晰的看到每个单词在整站页面出现的频率。 .

当然仅仅是靠这样是不能准确的技术的,那么LSI将引入一个关键词权重。1.关键词在页面出现的频率越高这个关键词在这个页面的权重就越高。2.就是整站关键词频率高的权重越低。 ..

LSI最重要的是可以算出站点某个关键词的相关关键词在其他内页的出现的频率。这样的好处就是即使你的某个站点页面未出现你搜索的关键词,也可能将相关的页面搜索出来。所以如果你做某个关键词排名还是把你所有的反向链接都用该关键词作为锚文本的话,那么你的反向链接的质量度会下降,就是LSI的作用。还有就是你站点页面做相关的长尾关键词相互提升其竞争力,就是因为他们的相关性。所以如果你还是用以前的方法来做优化,不做长尾关键词,不做相关性的话,那么你的站点关键词是很难获得很好的排名的。 ..

从上面的叙述的原理我们不难看出,为什么搜索引擎能够表现出这么好的智能,虽然LSI并不是理解某个单词的意思,但是他通过计算一个页面包含的关键词,并且参考其他网页所包含的关键词组成。所以LSI会得出一个结论,具有很多关键词相同的网页,他们的页面内容也是接近的。所以这就是为什么搜索引擎能够很多的判断伪原创和采集的页面的文章,所以你不要因为你改改标题,改改某些段落搜索引擎就不知道了。其实LSI就能够很好的判断。 。

这就是LSI的智能结果。 . 

那么我们链接LSI以后我们再来回答文章开通的一些问题,前几个问题就不用回答了,关于PR值现在是否起作用的问题,我的回答是否定的。PR算法现在还是Google的核心算法,现在没有变,以后也只是不断改进,也不会变。那为什么会出现PR低的站点关键词排名还比PR高的排前面呢?你要知道PR的算法,Google计算一个页面的PR值是计算其所有的导入链接,包括内链。但是Google更加看重那些具有相关性网站和页面过来的链接,而对不相关的反向链接在最后计算网页关键词排名的时候不会起作用。但是这些不想关的反向链接在计算PageRank是还是有用的,所以就会出现这种现状。PR高的关键词排名排在PR低的下面。 版权申明:本站文章均来自网络.

分析反向链接的相关性呢就是根据LSI。

扫描二维码分享到微信

在线咨询
联系电话

15929322171