快照数量多少虽然不能决定你的最终排名,但的确是作为一个重要的参考标准。一般的中小企业站收录普遍在1000条以下,甚至在500条以下。这就意味着,在相同的条件下,当然收录越多得分越高,排名越好。收录量不过百,但排名很好的情况是比较少见的,当然如果这个词没有什么竞争度还是多见。
我们从快照上可以判断网站的健康度,主要包括:快照数量增减、索引和快照数量不一致、site命令首页的排位、404错误页面多少、重复收录带www和不带www的域名页面、收录了不该收录的页面等。
快照数量的增减
快照收录有时候会因为算法的调整,会有波动,下跌100以内都是正常的。但如果超过这个合理范围,并且超过半个月没有恢复,就应该检查是否存在很多低质量页面,被算法去重了。另外有时候页面会出现404错误页面和一些带“?”动态页面,这些系统会自动移出索引库。
索引和快照数量
这两者是在绝大多数时候是不相等的,搜索引擎会对所有页面进行抓取并分析,内容质量比较好的页面会建立索引,并在一段时间内放出快照。每个地区甚至会有延迟,这就是排名并不是我们认为的可以人为控制。相关文章
一般以索引为主,用site命令查询的是快照数量,site命令查询的值容易出现波动。
首页快照消失
用site命令查询网站收录情况,一般首页会排在所有快照的前面。如果下落了两三位,但并不持续很久,两三天内就恢复的话是不用过于担心的。特别是我们提交了快照更新,排位是会受影响的。
笔者有一次页面做了较大调整后,提交了快照更新,然后好几天都没放出来,也就是本帖提到的首页快照消失。这时候最好尽量多做些高质量内容,让搜索引擎抓取。这次调整后,快照是过了3-4天才放出来了,排名得到了很大的提升,而且首页的logo图片也展示,是比较好的结果。如果你的网站不是这样的结果就要多注意了,毕竟好几天看不到快照也就是没有排名了,意味着你的业务会受影响。
做页面调整的原则是往好的方向调,一些没有点击的区域完全可以去除,页面过长的也可以砍掉。SEO优化做的首先是做减法,也就是大家说的“过度优化”。如果流量还不能满足,再仔细做需求分析,增加内容,丰富页面。
404错误页面
如果是动态页面,404错误一般是URL发生变化。如果是静态页面,404错误是该页面已被删除或目录结构发生变化。静态页面比较容易处理,动态页面就稍微复杂了。
路径做了伪静态后,如果动态的URL已经被收录,页面html返回码一样是200而不是404,属于正常页面,快照是非常难删除的。动态和伪静态页面有可能重复收录。
重复收录页面
由于没做好301处理,带www和不带www的页面URL路径不一样,但内容是完全一样的,类似下面的情况:
https://www.vi586.com/seo/ https://vi586.com/seo/ https://www.vi586.com/list.php?tid=1 https://vi586.com/list.php?tid=1
这上面的URL指向是同一个页面,前两个是静态URL或伪静态URL,后两个是动态URL。生成的静态页面稍有延迟,刚好蜘蛛来抓取,就有可能出现动态、静态内容不同步,页面相似度降低,容易出现动态、静态URL的页面重复收录,同样的这些动态URL快照都不好删除。
敏感文件夹或文件被收录
大家一定以为蜘蛛只抓页面上的内容,只会沿着页面上的锚文本爬取更多内容。一些敏感的文件夹或文件被收录,这是非常不安全的,容易被不法者利用。可用robots.txt进行屏蔽,参考文章
上面的方法处理好之后,想让这些敏感的快照彻底消失,可以把敏感的文件或文件夹重命名,造成404错误,但前提是要对程序比较了解,不然会容易出错哦。