欢迎来访-小涛SEO技术博客,专注分享SEO技术,SEO思维;提供网站SEO诊断,SEO优化;

百度算法之搜索引擎如何判断页面价值

SEO技术思维 小涛SEO 1126浏览 0评论

我们都知道,百度会给网站的每个页面评判价值,作为营销排名展现的一种因素。那么搜索引擎是如何来判断网页的页面价值的呢!一个页面是否是高质量页面还是低质量页面,这之间又有什么区别。之前百度算法工程师曾有透露过这方面 的一篇文档,随之马上又被删了,但是还是被有心的站长保留下来了,下面我们就来具体的说说百度搜索引擎如何判断页面价值的,首先贴一张图希望能帮助更好的理解。

搜索引擎如何判断页面价值

面对数以亿计的互联网网页,搜索引擎蜘蛛时刻都有大量的查询请求,而每个请求都说明了用户对某种资源的特定需求。一般,通过搜索相关关键词,在返回的结果中找到了我们需要的内容,也就是说我们的需求被解决了,也可以认为这些页面对特定用户的特定需求产生了价值。那么对于搜索引擎来说,这个页面的价值是指什么,作为一个SEO人员为什么要研究页面价值,技术上怎样判断一个页面的价值呢?若要知详情,请看下文讲解。

一、什么是网页页面价值

上面有说到,到你在搜索引擎搜索关键词的时候,在返回的结果中找到了你所需要的页面,也就是说这个页面满足了你的需求,那么我们就说这个页面是有价值的。这是对于用户来说,那么对搜索引擎,页面的价值体现在哪些方面呢?简单来说,就是所有可能会对用户产生价值的页面都有价值的,搜索引擎会将这些页面键入索引中,以便在用户搜索时能够满足用户的需求,我们叫这种价值为检索价值。那我们来给它做个定义:凡是能解决某个用户信息需求的页面,且可以通过正常检索需求到达的,就是有检索价值的。

判断一个页面是否有检索价值,取决于两点:

1)是否能够解决某个特定用户的需求(价值)

2)是否可以通过常规的搜索方式(比如搜索关键词)返回该页面信息(检索)

那么这样一来,是不是说没有检索价值的页面,对搜索引擎就没有价值了呢?显然,肯定不是。但是今天我们只讨论页面的检索价值,其它就不做详述。下文中提到的“页面价值”均是指页面的“检索价值”。

二、为什么要研究页面价值

有人就说了,为什么要去研究页面价值呢!互联网时代,信息漫天飞舞,网上的页面更是数以亿计无穷尽的,而搜索引擎的硬件资源却是有限的,那要想用有限的资源去覆盖无穷尽的页面,就需要对页面价值做出判断,不收录或者少收录那些没有检索价值,价值低的页面。任何一个搜索引擎蜘蛛的抓取能力都是有限的,出于对网站访问友好性的考虑,对一个网站或一个IP抓取速率要有一个上限。在这个限制下, 抓取或页面更新就要有先来后到,而这个排序的主要依据就是页面价值。

其次,对于某些页面内容发生变化导致成为死链,检索价值从有到无。对于这些页面,搜索引擎会在第一时间将其剔除索引库,保证返回的结果能给用户带来检索价值高质量页面。这样对用户的搜索体验也是一个提高,而对搜索引擎来说,越快收录和索引页面就意味着要更多的资源开销,收录的速度和索引更新的周期也要根据页面的价值来判断。

最后,搜索引擎在返回搜索结果时,在页面相关性差不多的情况下,用户更倾向于浏览普遍意义上页面价值高的网页。所以说,页面检索价值的研究是搜索引擎基础的工作,对页面价值的认识和判断的准确度直接影响着搜索引擎的覆盖率、死链率、时效性等几大主要指标。

三、怎么去判断页面的价值

举个例子,搜索某一个人的电话号码,搜索引擎返回的结果是这个人在某个论坛上的一个回复。虽然可能这个号码关心的人不多,但因为资源是绝对稀缺的,对于关心这个手机号码的查询需求而言,这个页面是完全不可替代的,所以这个页面有极高的价值。

此外,页面检索价值还和页面质量的有关系。内容相似的页面,对于满足用户需求来说,由于其他因素的影响往往会有很大差异,比如资源下载速度,页面的布局,浏览美观度,广告多不多。所以,一个页面的检索价值一般来说主要有四个要素的影响:页面受众群的大小、稀缺程度、质量高低、时效性强弱。

1、 受众群大小

受众群体的大小,代表用户检索需求的大小。评价受众的大小主要依据信息发布源的受众和信息内容本身受众两大方面。主要因素有:网站忠实用户群大小、资源分布规律、访问热门度、超链、内容特征。

2、 稀缺程度

页面的稀缺程度主要是描述页面在互联网中的独特性。那么稀缺是否等同于没有重复,其实不然,举个例子:

假如有人在自己的博客上发表了一篇针对某个热门新闻事件的原创文章,但是随后被新浪转载到了新闻频道。新浪的内容是不是重复呢?从客观上来看,确实是重复内容。但这种重复仅仅内容上的重复,新浪的转载带来了文章的访问速度、稳定性等方面的增益,通常我们叫站点增益。而在转载的过程中新浪可能会对原页面的标题做修改,依托新浪强大的受众,转载的页面可能会出现更多有价值的评论和回复,还有可能内容中存在指向其它相关事件的新闻链接。这些我们叫内容增益。所以即使主体内容没有变化,新浪的转载也是有价值的,稀缺度也是较高的。

同理反之,如果转载的网站是个不知名的小网站,没有带来站点增益和内容增益,那么这样的转载就是没有检索价值的。因此,对于主体内容重复的页面,应该判断是否存在有站点增益和内容增益,只要没有,我们就认为稀缺度较低。

3、 页面的质量高低

页面质量的高低是对需求的满足程度的一种体现。判断页面质量的高低,应该从最基础的需求依次递进。首先,不能是死404页面、网站要稳定、访问速度要快。其次,主体内容是否完整、浏览布局美观度、字体大小是不是有利阅读、广告多不多。

低质量页面的一些特征:

1、主需求无效/未满足(比如过期分类广告/软件下载页面,下载链接无效等);

2、存在内容死链;

3、虚假信息/诈骗等;

4、站点服务器不稳定,访问慢;

5、影响主需求的权限问题(比如下载/浏览需要注册会员/积分等);

6、信息内容不完整(转载不全等);

7、布局不好,浏览体验差(广告/字体/页面布局等);

反之可推断高质量页面的特征,这里就不一一细数了。

4、页面内容的时效性

页面的时效性是页面价值的一个属性,一般体现在两个方面:

1、是页面所描述的内容本身有着较强的公众话题性,容易被传播。

2、 是页面所描述的内容仅在第一时间有较高热度,随着时间推移热度显著下降,比如新闻事件。

页面价值中的“时效性”指得是一种突发时效性,也就是所有有价值页面中最需要及时收录的那些。判断页面的时效性价值,主要通过下面一些途径:

1、页面本身受众是否有短时间的突增,比如超链爆发。比如这段时间魏则西事件。

2、描述相同事物的页面是否有段时间的突增。魏则西事件短时间内爆发出大量相关讨论、报道,因此和这一事件相关的所有内容都具有了时效性属性。

转载请注明:深圳SEO技术博客_专注网站关键词排名,SEO技术经验分享 » 百度算法之搜索引擎如何判断页面价值