登陆 注册

双鱼论坛

[SEO知识] 百度收录量用什么方法进行估算

[复制链接]
网络营销 发表于 2020-7-17 11:02 | 显示全部楼层 |阅读模式
因为site指把搜索范围限制在了指定的域名内,所以站长和SEO人员认为如果不填写搜索词,而只用site指+域名所得到的搜索结果就是该域名所有被收录的页面了,返回的结果数也是搜索引擎对这个网站的收录量,site指令+域名所得到的结果都是指定域名内的,且百度给出了“找到相关结果数4240000个”,并特别注明这个结果是估算值。在Google中也会同样得到相似的结果,但是在Google中的“结果数”经常会变化很大,往往向后翻几页显示的结果数就变了。百度相对还好,一般会以周为周期来更新这个数字。

在其他很多地方,百度搜索工程师也都回应site指令给出的结果数只是一个估算值,并不是百度对网站的真实收录量,推荐大家参考百度站长平台的“百度索引量”数据。这里先来解释一下site指令的结果数是怎么估算出来的。

搜索引擎并没有呈现索引库中的所有索引网页,而是使用的缓存或者有效索引中的数据。由此推测:在搜索引擎接收到site指时也不例外,搜索引擎并不会浪费资源去检索整个索引库,而只是在缓存或有效索引中进行匹配检索site指令所得到的“收录量”为缓存(或有效索引)中该网站的网页数量,乘以搜索引擎缓存(或有效索引库中的总网页数和整个索引库中网页数的比值,示意公式如下:

5.JPG

ste指令显示的“结果数”差不多就是这样计算出来的,和alexa 工具对网站流量的估算类似(在第7章会有详细介绍),并不是搜索引擎根据实际索引库匹配出这些数量的网页。同时搜索引擎的缓存是多级的,有效索引库也是多个,所以对于不同的网站,估算公式中所使用的数据可能会来自不同的“缓存(库)。

百度官方人员给出的回复大概是:这个site指令是一个估算值,并不是真实的索引量百度索引网页有很多库,使用site查询时,会随机使用一个“库”中的该网站网页的数量来进行估算因为“库”是随机的,所以就造成了site指令所给出的数值可能会变动很大。

回复

使用道具 举报

广告客服|帮助中心|豫ICP备20018966号-2| 双鱼论坛

GMT+8, 2020-8-13 20:09

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.