配色: 字号:
百度搜索展示的基本原理
2016-07-18 | 阅:  转:  |  分享 
  
我们在百度或者其它搜索引擎上输入一个关键词,点击查询,搜索引擎会从

先到后列出大量的结果,看到这些结果,我们常会有疑问:这些结果是怎么来的

呢?排序的标准又是什么呢?这个看似简单的问题,却是搜索引擎研究的核心难题

之一。

为了解答这个疑问,特意写了这篇文章,为大家介绍一下百度搜索结果展示

的基本工作原理:

一、页面抓取原理

搜索引擎在抓取到我们网站的前提是必须要有渠道,当你新建一个域名,新

建了一个普通页面,页面没有经过任何人的访问,也没有任何地方出现过你的页

面,那么搜索引擎是无法正确的抓取到你的页面的,有些页面或网站之所以什么

都没有操作,搜索引擎也一样可以抓取和收录,其原因主要是通过以下几个渠道:

1、链接渠道

我们做外链的主要目的是什么,是传递权重还是能够更好的让搜索引擎通过

这个链接来抓取我们的站点,这是大家都在考虑的一个问题,其实更重要的是让

搜索引擎能够通过此链接正确的抓取到我们的网站,这也是SEOER都在说,现在

新站建议做外链,老站就没必要的原因之一。

2、提交渠道

80%的站点在建立以后会手动提交到搜索引擎,这是搜索引擎在收录到更多

站点的一个重点渠道,当搜索引擎不知道你的站点存在的时候,你提交了你的站

点,这就是直接告诉了搜索引擎,你的站点是存在的,值得搜索引擎的收录。

3、浏览器渠道

百度曾报道,360浏览器可根据用户流量的网页进行收集和抓取,也就是说,

当用户使用了360浏览器浏览了某一个未被360搜索引擎发现的站点,那么360

浏览器将会记录这个网站,然后将这个网站放到搜索引擎去处理,同样,我想百

度浏览器也会做类似的事情吧。

二、文章收录原理

一些SEO初学者,刚接触百度收录的时候,总会问:为什么同时发布两篇文

章,一篇被收录,还有一篇未收录?为何我在大型网站发布的软文未收录?等等收

录问题,其实百度对网站文章收录这一点看的相对严格,所以我们在这一点不能

掉以轻心。

当然,收录的原则也没有想象中那么复杂,如果你的网站能够健康的打开,

收录基本不是问题,只是时间问题,对于百度搜索引擎的收录工作原理主要有以

下3个:

1、对比

当搜索引擎在抓取到你网站的文章页面的时候,会识别你的每一个内页的相

同区与不同区,也就是说,你网站的不同区将会被定义为主题内容区域,然后拿

着你的主题内容与其他网站的主题内容进行对比,分出你页面主题内容的原创度。

2、分类

通过对你的站点进行对比后,可以直接对你的内容进行分类,如同博客的一

篇关于SEO相关的文章,搜索引擎可直接通过对比来判断,你的网站属于那种类

型,是否适合你的站点。

3、用户得分

分类之后,并不是代表搜索引擎就一定会收录你的文章,主要还是要依靠用

户的得分,用户的点击率、停留时间判断出此文的价值。

通过以上几点的算法,当文章的综合价值达到搜索引擎的标准值的时候,搜

索引擎将会对其网站页面进行收录。

三、页面过滤原理

很多网站页面被百度收录之后,百度认为该页面对用户没有太大的价值,或

者是质量度比较低的页面,百度必然就会过滤掉,这也是用户体验好的一种表现。

很多站点以优化为目的,丝毫不考虑用户的体验,例如一些桥页、跳转页面

这些就是典型,百度的k站就是一种过滤页面的表现,把那些作弊的站点的页面

全部的过滤掉。

很多人抱怨百度多次的k站事件,尤其是那些屌丝站长们整天在论坛抱怨这

个抱怨那个,为什么k你的站,很显然你的站点真的是以用户体验为核心运营站

吗?

做SEO的人大多都是为了优化而运营站点,每天写的站内的更新、做外链肯

定一部分是为了优化而优化,百度k你的站是牺牲少部分人的利益,更多的用户

是从中获益的,要知道每天有上亿人在使用百度,如果搜索出来的信息是你为了

优化而运营的站点,低质量的页面,那百度是拿自己未来的前途给你优化站点做

铺垫的,所以过滤页面这方面百度非常的严格。

四、页面信息展示原理

一旦搜索引擎抓取到页面,并且进行了收录和过滤后,接下来就需要给用户

展示信息了,对此,搜索引擎也需要经过以下2个主要步骤:

1、建立索引

经过了收录页面以及过滤页面的工作之后,百度会对这些页面逐一进行标记

和识别,并将这信息进行储存为结构化的数据,储存到百度的搜索的服务器中,

这些储存的数据有网页的信息、网页的标题关键词页面描述等标签、网页外链及

描述、抓取记录。

还会将网页中的关键词信息进行识别和储存,以便与用户搜索的内容进行匹

配,建立完善的索引数据库,方便呈现出最佳的显示信息。

2、显示信息

用户输入的关键词,百度会对其进行一系列复杂的分析,并根据分析的结论

在索引库中寻找与之最为匹配的一系列网页,按照用户输入的关键词所体现的需

求强弱和网页的优劣进行打分,并按照最终的分数进行排列,展现给用户,一般

显示出的最佳信息,需要关键词匹配最高的相关页面。

五、关键词排名原理

搜索引擎的排名原理是大家最最关心的话题,搜索引擎的排名原理是通过多

方面来给出的,不是单一的站内优化做的多好,也不是单一的点击率有多高,而

是根据网站的综合得分得出排名,这主要由以下几个点:

1、点击率

从百度站长平台的关键词工具可以看出,当你的网站排名在50页之前的时

候,点击率对你的网站有直接影响,这也就是很多网络公司接SEO的单,要求你

网站的排名必须是多少的原因之一。

2、体验度

页面的体验度是更具用户的需求来定义的,当用户的重点需求在图片的时候,

那么页面的体验度最核心问题就在图片上面,但是这种简单的需求,基本的网站

均可满足,重点还需要在简单的需求满足的情况下,在满足其他附加需求。

那么,搜索引擎为何能够知道用户的需求呢?主要原因还是用户在搜索框搜

索的内容均被搜索引擎所记录。

当然,遇到同样是图片的站点,排名的好坏还有更多的算法,比如用户在浏

览你的图片仅用1秒,而浏览竞争对手的图片用了30秒,这就意味着竞争对手

的内容比你做的好,停留时间、PV、跳出率成功了搜索引擎重点考核数据。

3、信用度

信用度的积累可直接让搜索引擎忽略很多细节问题,直接给与排名,这就是

我们经常在大站发布的外链软件很容易就获得排名的原理了,一个大型网站,经

过与搜索引擎的磨合,早已被搜索引擎加入到了信任用户,所以,后期的软文可

以直接让搜索引擎给他一个优势排名。



献花(0)
+1
(本文系wj201055131...首藏)