分享

网站内容不收录的原因和解决方案

 yfeiyang 2012-12-26

最近,网站突然从秒收变成了不收录,查了下IIS日志,发现蜘蛛爬行也很正常,就是只索引,不收录,非常郁闷。从网上找了些关于百度收录的内容,总结如下:

原因1:文章原创度问题,头部标签的设置导致页面类似重复,或者采集页面太多,因百度数据库中已经存在大量的相似信息而不收录,长期地操作会导致百度降权。

解决方案:应该保持文章的原创度(伪原创相信朋友们都熟悉),质量比数量更重要,最好是能每天定时更新让百度对你网站抓取也有守时的好习惯。

补充:关于定时更新的说法,本人不太认同,秒收的网站,任何时间更新都会被很快收录

原因2:百度已经索引了但还未放出来排名。百度对文章的收录需要审核时间,蜘蛛抓取成功索引内容录入数据库,需要经过二次审查是否为SPAM然后才放出参与排名,放出的时间与网站权重高低有着直接的关系,百度周期更新才放出收录是新站最为常见的现象。

解决方案:我们要做的就是保证定期定量的更新、观察网站日志,只要蜘蛛正常爬行,就静心等待着,会有惊喜的。另外,还需注意友情链接的质量。

补充:非主流图片http://www./在跟人交换了友情链接后出现上述情况,后来把有负面影响的链接去除,保持更新,内容页的收录就恢复了

原因3:robots设置问题导致内页不受引擎蜘蛛爬行索引

解决方案:检查是否语法错误屏蔽了蜘蛛爬行,其中包括meta robots与nofollow等标签的的设置。

补充:只有2B站长才会犯这样的错误

原因4:网站内部链接存在问题,比如有大量错误链接、不良的网站链接,蜘蛛爬行不通畅无法抓取,不良网址链接导致网站降权。

解决方案:针对首页、频道等各个重要页面做错误链接检查,检查留言板、评论等网友互动功能的不良链接,避免与不良网站互链。

补充:网站改版的要注意这点,光做好301和404恐怕还不够,要用百度站长工具提交死链

原因5:网站使用了黑帽手段,百度识别了欺骗手段整站降权。

解决方案:远离关键词堆积、群发,黑链等黑帽行为,网站的长期稳定少懂歪脑筋,百度一有动作就没很难挽回了!

补充:这个没什么好说的,自作自受吧

原因6:服务器无法访问,速度缓慢、被等情况。百度蜘蛛索引内容时,多次识别网站有着大量错乱代码或者遇到服务器无法访问,网站被列入观察名单。

解决方案:做好网站代码优化提高页面读取速度,选择负责任的安全空间服务商,成熟的网站程序并定期更新补丁,定期对修改文件痕迹做好跟踪。

补充:维护好服务器很重要,三天两头打不开的话还是趁早换空间

最后,还有人建议最好给网站做上网站地图,不过本人感觉sitemap.html好像用处不大,期待百度的sitemap早日开放。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多