分享

百度官方解答集:为什么蜘蛛天天来,而快照不更新呢?

 jmsxu 2016-02-22

声明:以下均来自百度官方及相关人员的解答。

百度官方解答集:为什么蜘蛛天天来,而快照不更新呢?

1.为什么蜘蛛天天来,而快照不更新呢?

官方解答:蜘蛛天天来,你需要看蜘蛛是否只爬不抓,如果只爬不抓说明内容还是存在问题的,要加大原创力度,或者说蜘蛛是否很难抓取,另外蜘蛛来了也抓取了也不会很快就更新,这之间是有一个过程的,蜘蛛需要对抓取的内容进行判断,并且快照也有一个缓存时间。一般情况下我们需要注意:

1、网站是否被降权,要是网站被降权了,要是网站被降权了,在搜索引擎那里属于审核期,网站快照更新慢或不更新是很正常的。

2、网站是否被挂黑链,被挂大量黑链的网站也经常会快照不更新,需要定期查看网站是否被挂黑链。

3、网站速度问题,网站的加载速度会影响蜘蛛的正常抓取,一般情况下网站都是从上往下的加载,而有的时候由于速度因素导致网站只加载了头部,后面部分而没有及时显示出来,也可能导致蜘蛛只抓取了头部部分内容,而由于一般网站的头部都是相同的,也就容易出现了抓取返回没更新的状态码。

4、网站内容问题

网站内容长期采集或是伪原创也能导致蜘蛛返回304状态码,因为网站内容采集或伪原创的确会降低网站质量,导致百度不收录等情况,搜索蜘蛛也会认为网站内容不具备收录的意义,那么也就不会抓取新的内容而返回没有更新的状态。

5、长时间不更新,页面长时间没有更新也会导致快照不更新的情况,你不是高权重网站,也没有大量其他外部来源,如果又长时间不更新,那么很可能就不更新快照。

6、蜘蛛问题,蜘蛛天天来,那来的到底是些什么蜘蛛呢?不是所有的蜘蛛来网站都会更新的,降权也说不定,所以我们需要分析网站日志,了解搜索引擎蜘蛛。

7、网页上有时间戳,然后时间戳代码长期没更新产生了快照异常。

8、百度问题,有的时候百度在更新之后会出现一些问题,导致失误,所以可以到百度快照投诉进行申诉。

9、百度会筛选一个最合适的快照进行展现,如果你的最新的索引快照不如之前的好,那么还是会展现之前的快照。

后来经过分析,发现是因为网页上的时间戳问题,经过修改和更新后恢复正常。

2.新网站、老域名如何才能让百度快速收录?

官方解答:首先了解该域名之前的内容,排除老域名因内容原因被百度惩罚。然后观察Baiduspider来访轨迹,确定是否有蜘蛛进行抓取。再看一下网页状态码返回是否符合预期。如果都没有问题,可以尝试通过url提交工具http://zhanzhang.baidu.com/sitesubmit/index申请百度抓取。

3.网站不做伪静态对收录有没有影响?

官方解答:对于不复杂的动态url,百度都可以搞定。

百度官方解答集:为什么蜘蛛天天来,而快照不更新呢?

4.伪原创内容对网站是否有坏处?

官方解答:视内容对用户的价值,无价值的纯粹的伪原创是会被打击的。

5.我们的原创内容被XX网站采集,他们是新闻源,但我们不是,这种情况该怎么办?

官方解答:百度倾向于收录原创的新闻内容。

如果确实有此情况,可以向站长平台的投诉反馈中心提交反馈。前提是你的网站不是因为被黑、软文等低质内容被惩罚。

百度官方解答集:为什么蜘蛛天天来,而快照不更新呢?

6.网站title关键词顺序,是否影响排名?

官方解答:不影响。

7.纯文本链接和锚文本链接,效果方面有啥区别?

官方解答:纯文本还是锚文本并不重要,重要的是是否出现在有相关度的页面上,百度现在对外链的依赖上已经很少了,研究这个意义不大。

8. 如果收录都被建入低层库的话,怎么办?如何提升上来呢?

官方解答:主要 问题在于内容质量。

好网页:无论从网站结构、怎么利于爬虫抓取,还是从用户体验,用户需求方面回答的始终有非常多信息来说明。可以归结为爬虫与用户。

众所周知,搜索引擎的索引库是分层级的,优质的网页会被分配到重要索引库,普通网页会待在普通库,再差一些的网页会被分配到低级库去当补充材料。目前60%的检索需求只调用重要索引库即可满足,这也就解释了为什么有些网站的收录量超高流量却一直不理想。

那么,哪些网页可以进入优质索引库呢。其实总的原则就是一个:对用户的价值。包括却不仅于:

1,有时效性且有价值的页面:在这里,时效性和价值是并列关系,缺一不可。有些站点为了产生时效性内容页面做了大量采集工作,产生了一堆无价值面页,也是百度不愿看到的.

2,内容优质的专题页面:专题页面的内容不一定完全是原创的,即可以很好地把各方内容整合在一起,或者增加一些新鲜的内容,比如观点和评论,给用户更丰富全面的内容。

3,高价值原创内容页面:百度把原创定义为花费一定成本、大量经验积累提取后形成的文章。千万不要再问我们伪原创是不是原创。

4,重要个人页面:这里仅举一个例子,科比在新浪微博开户了,即使他不经常更新,但对于百度来说,它仍然是一个极重要的页面。

9.网站标题是完全一致怎么优化?

官方解答:最简单的方式是每个页面使用文章标题作为标题,并加上网站名称。

百度官方解答集:为什么蜘蛛天天来,而快照不更新呢?

10.百度现在对URL中出现中文字符仍然不友好吗?

官方解答:现在中文目录或者url已经基本完美解决了,百度发表过声明的,收录时候会自动解析中文为编码收录的。

使用百度平台闭站工具后仍有抓取?

官方解答:通过反馈中心来反馈

----------------------------------------------------

本文由营销小能手整理

作者:任晓亮 QQ:541098712

营销小能手公众微信号:yx-xns 长按复制

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多