从2013 年,百度搜索发布首篇算法公告。经过 6 年的发展沉淀,百度搜索共计发布了 13 个算法、 48 篇公告及算法解读文章。2019 年,为帮助广大站长快速系统地了解搜索算法及规则、更好地提升自身网站质量,百度站长平台将算法进行梳理分类,汇编为《百度搜索算法大盘点》,助力站长全面获取算法最全信息。
1.网站内容质量1.1 飓风算法2.0——严厉打击恶劣采集行为百度搜索于 2017 年 7 月 4 日发布飓风算法,严厉打击恶劣采集问题,并在 2018 年 9 月 13 日公布飓风算法升级为2. 0 版本。 飓风算法2. 0 主要打击以下四类恶劣采集行为: 1. 存在大量从其他站点或公众号等内容生产方采集、搬运而来的内容,信息未经整合,排版混乱,文章可读性差,有明显采集痕迹,对用户无任何增益价值。 问题示例1:文章有明显采集痕迹 2.存在多段文章拼接的内容,文章逻辑性差,无法满足用户需求,阅读体验差。 问题示例2:文章内容拼接 3.站点内存在大量采集内容,网站自身的内容生产力极差。 4.站点内存在大量与本站主题无关的采集内容,领域专注度差,恶意获取流量。例如:科技网站采集大量娱乐八卦、社会新闻等情况。 问题示例3:学习类站点发布美食类内容 1.2 细雨算法——针对B2B领域的受益行为2018 年 6 月,百度搜索发布细雨算法,针对B2B行业的网站受益问题进行规范和引导。 细雨算法主要针对以下问题: 1.页面标题作弊及误导,主要有下面四类: (1)非公司官网,title中包含“官网”等字样,误导搜索用户认为是官网 问题示例4: (2)页面title中堆砌相近关键词; 问题示例5: (3)页面title中穿插火星文字或者特殊符号,影响正常阅读; 问题示例6: (4) 页面title中穿插受益方式。 问题示例7: 2.页面正文内容中存在受益信息,主要包括以下三类问题: (1)正文内容不完整,频繁穿插变形的受益方式。 具体是指:正文内容为无价值内容的拼接或者正文内容不完整,同时采用“英文字母”、“汉字谐音”、“特殊符合”、“全角符合”等方式代替联系方式,穿插在正文内容中。 举例: 5992 八⑧⑧⑧ 举例:13800138000 问题示例8: (2)文章的配图图片中存在受益联系方式。 具体是指:图片中联系方式水印面积较大,严重损害浏览体验。 问题示例9: (3)正文中商品或者服务信息内容为乱采集、拼接而成、排版混乱、用户从页面中无法获得商品或者服务信息。 问题示例10: 1.3 蓝天算法——严厉打击售卖软文、目录行为2016 年 11 月,百度搜索推出蓝天算法,持续打击新闻类站点售卖软文、目录的行为,还用户一片搜索蓝天。被“蓝天算法”所覆盖的站点将会被降低其在百度搜索系统中的评价。 问题示例11: |
|