观点 | 喻国明：“信息茧房”的锅，算法推荐不能全背

无问西东好 2020-04-14

展开全文

兵哥注：“信息茧房”（Information Cocoons）这一概念，是由美国哈佛大学教授凯斯·桑斯坦在《信息乌托邦》中首次提出，他用“个人日报”来形容互联网用户在海量信息中以个人喜好选择接触有兴趣的信息，进而对其他内容排斥与无视，长此以往形成“信息茧房”。信息茧房的形成往往被归因于“算法推荐”在新闻业大行其道。但作者认为，算法推荐机制并非造成“信息茧房”的核心原因。

喻国明：“信息茧房”的锅，算法推荐不能全背

来源：德外5号作者：喻国明

“算法推荐”对新闻业的改革推动力是巨大的：它在信息爆炸时代，高效对接了受众需求和信息；以今日头条为代表的信息分发平台也借此弯道超车，再塑话语权格局，拓宽受众信源。

与此同时，我们也无法忽视和算法推荐如影随形的巨大争议——“信息茧房”。学界对'信息茧房'声讨的基本逻辑是，算法技术以工具理性取代了人的价值理性，造成新闻专业主义的让位与受众信息端的日益窄化。

那算法推荐机制是否是造成“信息茧房”的核心原因呢？答案是否定的。那为什么不是？算法机制的完善路径又是什么呢？

“信息茧房”的“误读”

“信息茧房”（Information Cocoons）这一概念，是由美国哈佛大学教授凯斯·桑斯坦在《信息乌托邦》中首次提出，他用“个人日报”来形容互联网用户在海量信息中以个人喜好选择接触有兴趣的信息，进而对其他内容排斥与无视，长此以往形成“信息茧房”。

桑斯坦认为，由于“信息茧房”的存在，人们只会选择和接触与自己意见相同或近似的人群，采纳符合自己预期的观点，于是逐渐形成“回音室效应”（Echo Chambers），个人所认同的意见和观点，以及所感兴趣的事物，都会在这种传播场域中得到“正反馈”式的激励和放大，所谓“强者愈强，弱者愈弱”。照此推理，“回音室效应”会导致人们成为认知上的“井底之蛙”，误把“私域”（某圈层）的事物和观点等同于“公域”（全社会）的事物与观点，进而形成“刻板成见”并在与圈层以外的意见与观点对冲时或感到迷惑茫然，如同见到无法理喻的“外星人”，或走向认知上的极端和表达上的极化，成为群体化事件的温床。

近年来，“信息茧房”成为研究热点，关于“信息茧房”的治理方式的研究更是成为多个学科中的热点问题：基于公共领域的本质特性，新闻传播学对“信息茧房”的隐忧和批判明显多于其他领域，但同时也存在着相当的误解，研究表明：

（一）“信息茧房”一直存在

被誉为传播学四大奠基人之一的香农（ClaudeE.Shannon）是“信息论”的提出者，他认为“信息是用来消除随机不确定性的东西”。同为传播学奠基人之一的霍夫兰（Carl Hovland）所提出的“个人差异论”其实早已阐述了受众的“选择性和注意性”理解。对这一理论的理解是随着时代的变迁而不断展开的，大众传播时代，“个人差异”主要体现为对统一的大众媒体上信息的理解，那么信息技术与移动互联技术所共同促成的当下海量信息与个体化消费的现状，则将更多指向“选择”，每个人的个人媒介选择都存在巨大的差异。

即便在互联网出现之前，媒体会根据自身市场定位及角色担当，以某种价值框架来选择性地呈现和反映这个世界；受众也会以自我价值为核心，以一定的能力、意愿、兴趣为半径为自己建立信息渠道。所不同的是，互联网时代开启了个人寻找信息的便利性，同时也开启了信息找寻人的便利性，双向互动是互联网对信息传播渠道的最大贡献。而所谓的以个人兴趣为核心的“信息茧房”本身，其实是由个人的选择和注意所决定的，算法与数据技术不过是媒介的价值选择机制在数据条件之下的一种“人体的延伸”，并不是形成“信息茧房”的独特成因。

（二）“信息茧房”是海量信息差异化消费的必然结果

当下的信息总量无疑是惊人的，且是急速更新、海量增长的。Facebook每天产生4PB的数据，包含100亿条消息、3.5亿张照片和1亿小时的视频浏览。据Smart Insight统计，目前，全球每天有多达35亿次搜索来自Google，相当于每秒4万多次搜索。而在中国，百度更是面对着每天60亿次左右的搜索请求。与如此大的信息量相比，个人的信息系统的容纳量就愈发显得渺小、狭窄甚至不够多元。同时，在如此浩瀚的信息海洋里固守一些自己习惯和评价较好的信息菜单和信息渠道，甚至可以解释为在信息过剩时代的某种自我保护，是现代人以个体为基础信息消费的必然结果。

（三）“信息茧房”是“独异性”社会的外在表现之一

用“个性化”一词，已经不足以表达当下社会与现代社会的根本区别了，德国社会学家安德雷亚斯·莱克维茨提出了更为贴切的概念“独异性”。在信息行为领域，个人不再遵循大众媒体时代的信息编排、时空限制，而是以个人的兴趣为核心去为信息制定价值，这也必然会造成与传统大众媒介时代相比，个人信息系统的千人千面、各有所好。这是社会发展和人们信息消费迭代升级的外在表现之一。

“编辑权”的迭代：从精英、个人到机器？

人类的信息分发模式迄今为止经历了三个主要的发展类型：1.倚重人工编辑的媒体型分发；2.依托社交链传播的关系型分发；3.基于智能算法对于信息和人匹配的算法型分发。如今的传媒领域已经与信息系统须臾不可分，站在受众的立场上，严肃媒体、娱乐媒体、生活信息、消费信息、社交信息等等并没有清晰的分野，个人以终端接入信息海洋，以时间为线索编制个人信息系统，不断接收流入个人信息系统的内容，并对内容作出基于场景、情绪等非理性因素的选择。这与大众媒介时代最根本的区别在于，宏观系统的绝对复杂化与个人系统建立模式的不可捉摸。

算法本身是一个用系统方法描述解决问题的策略机制，在信息系统与人的匹配中无疑是高效、先进的工具。算法机制要解决的根本问题是：从庞大复杂的信息系统中挑选符合用户兴趣习惯和社会特征的内容，呈现在他的个人信息系统中，以满足他的内容需求。这一过程在大众传播时代由专业媒体人完成，“编辑”是“把关人”职能的具体表现，“编辑权”是媒体精英时代的职业权力，媒体人依靠这一权力为所谓“大众”挑选“合适”的内容，并赋予内容不同的权重，最后呈现给受众的是一系列带有结构和秩序的信息集合。

然而个人移动终端的普及，首先将大众传媒的依靠时空垄断和资源垄断维护的信息秩序彻底打破，人沉浸在信息冗余、时刻在线的传媒环境之中。根据美国南加利福尼亚大学2013年发布的“媒介消费量使用报告”，美国人2015年个人日均媒介的使用时间是15.5小时，时至今日，这一沉浸信息之中的时间更是达到非工作时间的极限。

在不断涌入的信息之中，谁是新的信息“把关人”？正如英国文化研究专家拉什（Scott Lash）所说：“在一个媒体和代码无处不在的社会，权力越来越存在于算法之中”。当下的信息环境中，对信息“编辑”的权力已经被让渡给两个逻辑：一是，让渡给社交关系，二是让渡给平台算法。前者由社交关系中的个人转发评论和点赞来“编辑”个人信息系统，后者由算法根据个人的既往阅读轨迹与特性来挑选内容，进而“编辑”个人信息系统。社交推送和算法推送的共性在于，它们都属于被动接收式的“推送”；而这两者的区别在于，社交推送可被调整——个人如果对来源于社交关系中某些信息质量存疑可以通过“取关”“屏蔽”来调整个人信息源；而算法推送下，用户缺乏主动的调整权，在对算法不满意的时候缺乏必要的反馈渠道，对某些内容推送的被动认知会累积成对于推送平台的反感情绪。

美国麻省理工学院社会心理学学者雪莉·特克尔（Sherry Turkle）评论说：移动互联网已然将我们带进了一个“持续分心的世界（the World of Continual Partial Attention）”。对用户来说算法推送内容无疑是一个不断打扰注意力的过程之一，这种对注意力的干扰挑战了内容消费的主体性。互联网以及此后的移动互联、人工智能等技术与互联网之前时代的一个本质区别就在于，为个人的主体性开辟了渠道——用户不但可以被动接收信息也可以主动发布信息、选择信息。基于算法技术的信息“分配”，其实是在主体性十分强大的用户个人信息系统中，充当了对这种习以为常的主体性的挑战者。

算法推送的大势所趋：必然、实然与应然

有学者将当前传播业归纳为三重逻辑：计算机逻辑（Computational Logic）、媒体传播逻辑（Communicative Logic）、社交逻辑（Social Logic）。所谓计算机逻辑是指，基于计算机技术和大数据算法，对内容传播的收集、制作和分发，依赖于无限的数据与内容，媒介信息与受众信息都无限丰富；媒体传播逻辑，是指从媒介生产的角度出发，不断审视渠道的变迁，受众的变化，力求在生产立场上更多地调整和融合，以维持受众的关注度；社交逻辑是指，由于社交媒介的无处不在，以及通过社交媒介消费新闻和资讯的普遍性，消费者之间的关系网正在与信息传播网络镶嵌在一起。三重逻辑之间互相影响，互相辅助，成就当下传播业的基本局面。

我国对于算法在新闻传播领域中应用的研究主要集中在2012年之后，尤其在针对“信息茧房”的讨论中，算法诟病成为焦点问题，声讨的基本逻辑是，算法技术以工具理性取代了人的价值理性，在工具所带来的“不适当”“不正确”之中，当下的技术显得笨拙而难堪。

目前主流的推荐算法，尤其是针对内容推送的算法，主要是一种语义算法，其核心思想是将语义知识融合到推荐过程中，来克服传统推荐算法的不足。基于对内容的标签化分类，与对用户的分类做两者之间的匹配——基于语义的内容推荐算法、基于语义的协同过滤推荐算法、基于语义的混合推荐算法以及基于语义的社会化推荐算法。算法推送的本质是科学而有用的，但在实际应用中遭遇了阶段性问题。例如，在现在的算法还不足够“聪明”的情况下，用机器智能完全替代人的“把关”，这样的资讯“把关人”是否可以完全信赖？由于算法性信息分发更多地建立在对于人们的直接兴趣和“无意注意”的信息需求的挖掘上，它的直接后果是造成对于人们必需的那些非直接兴趣和需要“有意注意”问题的忽视，等等。这些社会质疑对于算法型信息分发是不能不面对与正视的。

（一）算法的必然：链接了人与信息

算法的本质是建立在海量信息和海量用户之间的匹配技术，是ICT技术发展的必然。如果没有算法的介入，海量信息将无法完成更为有效的传播。曾经在“大众传媒”与“大众”之中桥接信息的“发行”“收视”工作，对受众需求的颗粒度分析是粗放的，是一种满足最大公约数需求的信息传播与消费模式；而在信息碎片化、用户个体化的当下信息传播系统内，算法以先进的技术链接海量的信息与个性需求的人，其存在和不断发展是必然的。尽管智能算法分发中应用了各种模型或公式，但其基础原理是朴素的：更好地了解待分发的内容（标签化处理），更好地了解待接收的用户（用户洞察），更高效地完成信息与人之间的对接（场景洞察）。

在这个信息海量的时代，无论是信息消费者还是信息生产者都遇到很大的挑战：对于用户而言，从大量信息中找到自己感兴趣的信息是一件非常困难的事情；而对于信息生产者而言，让自己的信息脱颖而出，受到广大用户的关注，同样也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息，一方面帮助用户发现对自己有价值的信息，另一方面让信息能够展现在对它感兴趣的用户面前，从而实现信息消费者和信息生产者的双赢。

（二）算法的实然：简化了人与信息的关系

以目前的发展阶段，算法最受诟病的根源在于它的“不可见”，在于不同的机构、系统赋予算法不同的模型和赋值，更在于这些简化的赋值方法、模型方式，在海量的信息中不断打捞重复、无效、雷同的内容，造成个人对信息“偶遇”的“疲劳”和“不满”。

算法型信息分发的本质应该是用户价值主导下的场景化适配，目前对个人需求的简单量化，正是香农所说的“工程传播”的基本逻辑方法，这种逻辑方法的底层，一是简单归类，二是无视变化。海量信息时代，算法对受众的“标签”如果仍然停留在大众时代的受众观念之中，粗颗粒地归类，必然会造成对需求理解的不对位，预测的不准确；如果对受众需求的认知是固化的，比如会造成观看一次内容，就不断持续推送类似内容的问题，对分类和流动性上的要素缺失，无疑会造成当下的矛盾——用户需求的流动、复杂、演化与信息供给的固化、简单、重复之间的根本矛盾。

当然，算法推送技术也在不断克服各种困难，如为减少标题党新闻的推荐，一些算法型内容分发的互联网企业已经作出了一些探索，如今日头条建立了检测“标题党”的规则模型，以警示头条号作者的“标题党”行为。当头条号作者预发布文章的时候，如果标题中出现了“惊呆”“震惊”等内容，会收到一个飘黄的窗口，提示其内容涉及标题夸张，建议修改，如果作者继续强行发布将会被限制推荐量。这些都是算法推送正在不断修正和优化的事实。

（三）算法的应然：协同人与信息

算法推送是算法在媒体平台中的应用之一，面向信息推送，基于算法的内容推送将不再依赖记者、编辑等单独点的信息采集，而是通过对大数据库的实时分析，构建起跨语言、深层次、全局性的认识事物、表征和预测现实的模型，突破了以往人们“脑海真实”的片面性和局部性，从而仿真出无限逼近于客观真实的“符号真实”。因此，算法推送从根本上说，是协同人与信息之间客观真实关系的重要工具。

面向未来的算法，则更将指向更为革命性的人工智能领域。“人工智能技术”的“智能化”程度取决于计算能力、数据与大数据以及算法模型的“三位一体”的品质。与人工智能相对应的是自然智能，是依靠自然进化所造就的智能，例如人类智能，但人类的智能由多种智能构成，它们分别是：语言智能、音乐智能、逻辑一数学智能、空间智能、身体动觉智能、人格智能和自省智能。人工智能始终在学习怎么成为人，但是在人格、自省、音乐、语言等非数理领域，需要依靠更为多元、精密甚至革命性的算法来实现与人类智能之间的协同。在整体性内容需求市场上，目前基于“弱智能”的智能算法在相当程度上还不能完全替代人工编辑，传统的人工编辑仍然担当着“压舱石”“航向标”式的角色，智能算法提供工具性辅助。人工智能技术将人类智能和机器智能相结合，人机关系更加紧密和复杂。即使算法分发占据大半壁江山，信息传递的核心地位依然应该是人。

______________________

纸上谈兵【ID：paperstrategy】关注报业转型，传递报人创意，汇聚报改资讯，提供有价值的传媒集团样本观察、分析和解读。