分享

决定“今日头条”算法价值观念的四个要素

 alayavijnana 2017-09-19

算法分发逐渐成为网络新闻主要的分发方式。郑州大学新闻与传播学院王茜以算法分发模式的先行者——今日头条为研究对象,运用内容分析法考察了算法自动化选择和衡量新闻价值客体的标准。通过分析郑州大学77位用户的8000多条新闻推送后发现,今日头条算法价值观念主要包括四个要素:场景、内容、用户偏好和平台优先级。这些标准内嵌于代码编写与设计之中。


1.场景


移动传播的本质是基于场景的服务,即对场景(情境)的感知及信息(服务)适配。在本文中,场景因素主要表现为本地新闻的高覆盖率。如表1所示,覆盖率50%以上的新闻中,本地新闻占一半以上。“洛阳原书记被控收受1.48亿”这条新闻被推送给52名参与者,覆盖率最高。


↑↑覆盖率50%以上的新闻推送


接近性是新闻价值五要素之一,而LBS(基于地理位置的服务)、物联网等技术为更精准的信息适配提供了技术支持。今日头条推送了九条有关郑州大学的新闻,其中“郑州大学校运会开幕式大观”“郑大与郑州舰签订双拥协议”,以及“郑大校内柳絮纷飞”的覆盖率分别达到48.05%、42.86%和33.77%。此外,42位参与者曾在晚间收到今日头条推出的“夜宵”新闻,即一组当天发生的要闻集锦。这也是根据场景因素,即用户的作息习惯,而进行的算法分发。


2.内容


尽管今日头条声称其没有价值观,然而,本文研究发现,具有重要性、冲突性以及流行度的内容更容易通过算法筛选过程并进入用户视野。


媒体人吴晨光曾介绍新闻客户端的推送规则:“当新闻足够重大时,可从不同的角度Push多条,形成持续关注度”。重要性是新闻推送的准则之一。在为期三周的时间里,参与者收到最多的新闻类型是军事新闻(28.63%)。笔者把所有军事新闻标题导入“清博词频统计工具”,导出结果显示“朝鲜”一词出现频次最高。在记录期间,朝鲜核问题、萨德问题是国际社会关注的热点议题,今日头条对各方回应、事件发展动态进行了持续推送。


参与者收到的社会新闻(27.67%)排名第二,其次是时政新闻(13.59%)。笔者分别统计了这两类新闻标题的词频。如图2和图3所示,有关凶杀、强奸、车祸的社会新闻,以及有关官员落马、贪污腐败的时政新闻更易得到今日头条算法的推荐。这些新闻都具有较强的冲突性,包括人与人之间的冲突、官员落马前后形成的反差等,易吸引人眼球。



娱乐新闻(10.76%)占比排在第四位,余下的新闻类型占比均在10%以下。如表1所示,今日头条为50%以上的参与者接连推送了“白百何出轨”事件。在为期三周的时间里,每位参与者平均收到5条有关该事件的新闻推送,最高者收到12条相关推送。由此可见,具有流行度的新闻也会得到今日头条的优先推荐。这一发现与杰姆斯·韦伯斯特 (James G. Webster)的研究结果相符,即搜索引擎、社交网络、协同过滤系统等在进行信息推荐时都倾向于把“流行度”(popularity)作为消费指南。


3.用户偏好


“你关心的,才是头条”这一广告语显现了今日头条对用户偏好的注重。受尼尔·瑟曼(Neil Thurman)研究的启发,本文把用户偏好分为两种类型:第一种是用户主动表达的偏好(explicit preference),包括点赞、评论、收藏、关注、转发、搜索、屏蔽。第二种是指用户含蓄表现出的偏好(implicit preference),主要是指媒介组织通过搜集和分析用户数据而推导出的偏好。这些数据包括用户的注册信息、社交账号、GPS定位、IP地址、使用的手机型号等。分析结果显示,今日头条给每位男生平均推送了18.38条体育新闻,给女生则推送了1.53条。由此可见,性别等人口统计学特征也被用于推测用户偏好。


值得指出的是,将于2018年5月在欧盟正式实施的《一般数据保护条例》(General Data Protection Regulation,简称GDPR)第22条规定:“数据主体应该拥有以下权利,即不受仅仅基于自动化处理(包括画像)所做出决策的制约,如果该决策会为他或她带来法律后果或其他显著影响。”本文认为,今日头条所进行的画像显著影响了用户的信息消费。GDPR条例第4条对“画像”(Profiling)进行了明确定义:“指任何通过自动化方式处理个人数据的活动,该活动服务于评估个人的特定方面,或者专门分析及预测个人的特定方面,包括工作表现、经济状况、位置、健康状况、个人偏好、可信赖度或行为表现等。”在本研究中,参与者收到的新闻推送在很大程度上反映了今日头条算法对“用户特定方面”的评估,包括位置、个人偏好、性别等。


今日头条有多了解我们呢?曾经有研究者分析了5.8万名志愿者Facebook上的点“赞”,据此推测出了一系列高度隐私的个人特质,包括性取向、种族、政治观点、个性特征、智力情况、快乐程度、上瘾物的使用、父母离异、年龄和性别。可以预见的是,随着物联网、人脸识别等技术的快速发展,算法将积累越来越多的用户数据,变得越来越“智能”。与此相伴随的是“谁来约束算法”的问题。


4.平台优先级


德维托分析指出,平台优先级(Platform priorities)是影响Facebook信息流呈现的因素之一,例如Facebook会在用户信息流中优先呈现自己平台上的视频而非YouTube上的视频。分析发现,平台优先级也是今日头条算法价值观念的要素之一。


如前所述,今日头条把一些非新闻类资讯也推送给了用户,共有47条。这些资讯涵盖了以下类型:头条问答(例如“为什么说千万不要一个人吃海底捞?”)、图片(例如“老照片:30年前的河南嵩山少林寺”)、短视频(例如 “找些废品,在家动动手,这么高大上的东西你也可以拥有”)、人物故事(例如“数学天才18岁被保送北大,三次创业三次成功,连追女友都是算概率”)。这些非新闻类资讯均来源于今日头条的自媒体平台——头条号。


张一鸣曾表示:“传统媒体是把观点告诉别人,今日头条是提供实用信息,比如给养猪专业户提供更好的养猪信息,告诉强直性脊柱炎病人如何治疗。传统媒体是传递价值观,我们只是让有益的信息到达个体。”作为一家商业公司,今日头条的运转核心——“一套由代码搭建而成的算法”——会受到公司整体战略布局的导向和影响,并优先推荐本平台生产的内容,无论内容本身是不是传统意义上的新闻。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多