分享

如何加快搜索引擎对网站页面的收录-简美总裁陈炯的博客

 网游盛世 2010-03-23

在谈如何加快Google和百度对网站页面的收录之前,我想先解释一下为什么要加快收录速度。所有的站长都希望自己的网站能够有比较好的搜索引擎表现。那么影响自己搜索引擎表现力的其中一项就是网站被收录的页面。虽然不是绝对,但是普遍来说,页面收录量大一些,网站的整体搜索引擎表现就会好一些。同时,网站的搜索引擎推广绝非是几个关键词的优化,而是一群关键词都得到较好的排名,利用长尾理论,每个词贡献几个访问量来源,最终汇集成为一个巨大的搜索引擎访问量来源。同时,还能更加广泛地抓住潜在客户。要做到这点,网站的页面要尽可能被搜索引擎收录,不然就无法做到一群关键词都获得很好的排名。所以,尽可能地让自己的网站页面都被收录,这是所有站长都应该做的。

 

要做好搜索引擎的收录,其中最重要的还是网站的结构。要说明这个问题,请允许我介绍一下搜索引擎爬虫的工作原理。搜索引擎爬虫来收录网站并非一次性就将整个网站就走一遍的,甚至很多时候爬虫只是检索了几个页面就会离开了。同时,爬虫的工作分成两个,一个是建立网址检索任务,第二个是对任务表当中的网址进行检索,并存入搜索数据库。只要网站的所有页面被放进了检索任务表,那么爬虫就一定会来进行那些网页的收录工作。

 

那么网址检索任务又是如何建立的呢?当爬虫在检索某一个页面的时候,它会将这个页面所包含的站内网址放入检索任务表。但是,并不是一定会将所有的网址都放进去的。爬虫会选择什么网址?多少网址?其实并没有什么规律。不过似乎越靠前的网址是越被重视。而且似乎遇到了站外链接、网址数量过多、重复的网址出现在任务表中的时候,就会停止收录网址。而一旦停止,那么只有等待爬虫在下一次来访网站的时候才会更新网址任务表,那很可能就是几天之后了。根据这个情况,如果想要让网站更好地被收录,要做到以下几点:

 

1. 网站的内容要层层递进,通过一个清晰的网站链接结构,帮助爬虫在几次来访网站后就可以把主要的网站页面全部收录。清晰的结构通常是一个树状的,而且层级最好不要超过4层。网站结构主要体现在导航条的部分,通过首页的导航和每个栏目页的二级导航进入到内容列表页,最后指向文章页。

 

2. 首页的导航和栏目页的导航一定要在代码位置靠前,避免爬虫在抓取到导航链接前就离开网站了。

 

3. 列表页要巧妙使用翻页机制,同一个页面当中列表的条数不要超过50条。数量太大,爬虫会离开。翻页空间也要做成第1.2.3.4.5.6.7.8.9页这样的模式,把后面的翻页列表也让爬虫抓入任务列表库。

 

4. 文章页内是链接最少的页面,要充分利用这个特点,让爬虫在文章页抓取的时候也能够收录到网站内其它的页面。这就需要文章内容页要有相关文章和推荐文章的链接。让爬虫在文章页进行网站结构的横向抓取。

 

5. 一个小技巧是做好Google Sitemap并且进行准确的提交到网站管理工具当中去。这对Google的抓取很有帮助,是一种主动为google提供抓取任务表的方式。另一个窍门是sitemap可以不止一个,而是每个栏目一个,这样可以做到同步提交,加快收录速度。

 

6. 让最新的文章尽快的被收录也是能够让收录量不断上升的方式。所以我们可以通过在首页把最新的文章进行展示,即可以保持网站的更新频率,又让最新的文章尽快被收录。

 

7. 网站的内容是一个持续的增长。有的网站通过信息抓取工具,从其它网站抓取大量文章,一次性导入到自己的网站当中来,其实是很不健康的。搜索引擎对于这种短时间内的突变非常敏感,甚至可能会进行惩罚。所以,文章的增加一定要稳定、持续。例如每日20-30篇的数量。

 

8. 最后,别忘记了在搜索引擎网站提交入口做一次提交。通常Google提交的一周左右开始进行收录,百度要2-3周才会开始收录。(百度开始收录后,只有首页显示被收录,剩下的页面通常要等一个月甚至更长的时间才会显示。)

 

9. 多做一些外链,这样可以增加爬虫从其它网站来访的几率,从而让爬虫来访的次数增加,自然增加收录速度。

 

最后,以我的经验来看,对于企业网站,Google收录数在1000以上的时候,整体网站的各个页面的搜索引擎表现力会有比较明显的提升。收录数对百度的影响较不如google的明显,但是也是非常有用的。由于google的收录比较有规律,也比较及时,所以大家可以以Google的收录作为标准,然后等待百度的收录慢慢提升上来吧。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多