营销知识
您的位置:主页 > 营销知识 >

狗小云引擎算法研究2(隐含语义索引原理)

网站编辑:红莲 │ 发表时间:2012-03-12 21:06 | 文章标签:搜索引擎算法研究,隐含语义索引

成功实现,无限接近,模拟百度隐含语义索引原理技术 -

下面是利用安装在服务器蜘蛛,分析出的,“SEO”这个关键词,30天内所有站点文章数量走势,蓝色的代表原创走势,红色的代表,原创后,被大量转载转发的,也就是非原创的文章走势,可以看到3月1号左右,有了大量转载群发,可能是花钱,群发的吧。 

图片

 

    以前光知道语义索引的理论,终于可以应用于实战了,   下面文章引用于网络,写的非常清晰了,我就不重新写了,重点演示模拟百度隐含语义,引导站长告别低端SEO,告别搞链接的农民苦海,进入高端SEO行列,不靠外链照样能排名。 

1、隐含语义索引原理的作用

  隐含语义索引原理主要是解决文章内容标题。包括下面几个方面:

  ①、内容的重双标题

  ②、要害词的相关标题

  ③、要害词的密度标题

  ④、要害词堆砌标题

  ⑤、文章原创标题

2、要害词密度标题

  我们学习SEO卖前经常正在考虑,搜索引擎是怎样断定我们的文章能否原创的呢?怎样断定我们一篇文章是质量高还是质量低的呢?怎样样可以晓得我的文章有没有要害词集合?怎样样可以晓得我的文章中的要害词密度。这个隐含语义索引原理就是如今主流搜索引擎用的一个核心的索引原理。它是基于中文分词原理来的。我们前面的课程中有具体的讲过中文分词原理。

  中文分词原理就是说,搜索引擎假如要经过上千万亿个网页走断定某个要害词的要害词排名,并且计算它的排名的话,是非常非常困难的。不可能像如今这样,正在零点零几秒就可以计算出一个结果出来。汉语的词汇量,一共只要8万条。经过语义索引,把上千万亿个网页决裂成了8万条词条上面,就使得计算变得非常的简略了。使得计算从一个很双杂的、非常庞大的数字,酿成一个计算机可以人为控制的数字了,仅仅只要8万条。

  搜索引擎的蜘蛛把一个页面里的代、文字全都下载下来之后,它会进行分析。把这个页面里面一切的中文字词整理出来,进行切割。这个切割的过程就是分词,把页面内容分成若干个不可再分的词。然后把一些过路词走?失。什么是过路词呢?这个、那个、正在、的……等等等等,这些要害词是没存心义的词。只留下一些名词、动词、描述词。

  把一个页面分化成这些词卖前,就开端统计每个词出现的次数和频次。这样搜索引擎就晓得了你的要害词正在页面出现了几次,也就算出了要害词密度。

3、要害词堆砌标题

  搜索引擎晓得了你的要害词正在页面出现了几次,也晓得了跟它相关的词又正在页面出现了几次。比如你一个词出现了100次,它的相关词只出现了2次,搜索引擎就晓得你肯定是正在堆砌要害词,是正在作弊。所以说,有没有要害词堆砌,这是可以算出来的。并且差别的行业差别的词,它们的比率是不一样的。这就解决了要害词堆砌的标题。

4、相关要害词标题

  相关要害词它的比率到底是几多呢?比如说SEO培训,“SEO”出现的次数,和“SEO培训”出现的次数,他们的比率是几多。再比如上海不锈钢,“上海”出现的次数,和“上海不锈钢”出现的次数,他们的比率又是几多。这个别家是可以算出来的。你正在一篇不相关的文章插进一个要害词。比如网站上面基础没讲SEO,你插一个“SEO”正在里面。这个时分“SEO”可能就会起反作用。由于它经过隐含索引原理,可以计算出来,你这个要害词跟你这个页面不相关。

  
5、隐含语义索引原理的引申考虑

  关于隐含语义索引原理,我们可以考虑两个标题。

  1、维持页面上要害词的最新相关。差别的时期内,一个要害词的相关要害词是差别的。我们要连续调解我们的页面内容,使我们页面上的要害词维持最新的相关。这样搜索引擎就会连续觉得我们这个网站是有价值的。

  2、钻研那些外部链接相比少,而要害字排名相比靠前的网页。这些页面,阐明百度对他的内容质量是打了高分的。

 

图片

                                                                对某医疗站点分析

 统计以上,密度词汇,互相组合使用的次数,组成语义索引关键词矩阵 

图片

 

 

制作关键词,阵列罗盘:这是组合使用次数,最高的几个关键词

 

图片

 

 继续统计,计算相关性 

图片

 

最后得出站内相关性最强的几个 关键词组合,   我们看到,他网站内的,算法解释出的,词汇组合,根本 与 百度的贴合度不够, 这个时候,就需要调整了

 

 

 

图片

扫描二维码分享到微信

在线咨询
联系电话

15929322171