分享

李彪:从属性数据到关系数据: 社群时代新闻传播学研究方法新转向

 pursuitman 2020-06-24

社群时代传统量化研究方法的局限

(一)问卷调查法的局限:“社会科学的绞肉机”

问卷调查是传播学最经常使用的一种量化研究方法,但很少有人去思考问卷调查法在研究假设上存在以下几个问题:一是问卷调查法的基本假设是人们的行为是由人们的属性所决定的,因此在问卷设计时都会对人的属性(性别、年龄、学历、职业、收入)进行调查,进而进行回归分析,将人的行为设定为因变量,将人的属性设定为自变量;二是问卷调查建立在人们在面临选择时能够完全自知选择的基本假设上,并认为人做问卷时的理性选择等同于行为选择,但这是一种在完全不受干扰下的理想状态的选择;三是问卷调查法会消弭社会个体的个性差异,问卷调查将一个个具有个性的社会个体转化为数据集进行总体分析,进而消弭了个体的差异,这些都一定程度上使得问卷调查法越来越受到一些研究者的质疑,尤其是大数据挖掘技术的崛起。

(二)内容分析法的局限:无法适应碎片化的语义链

大数据时代来临,除了传统的文本信息,互联网上的一些行为数据也逐步纳入到传播学研究的范畴,内容分析法越来越不适应社交传播时代:一是传统的内容分析法只适合研究那些明确地、显在的传播内容,在处理意识形态、观念、价值、意义这些含义精妙的概念以及碎片化、语义断裂的聊天记录方面还比较薄弱;二是随着内容分析法主要用于文本的分析,内容编码也越来越陷入形式主义,类别越来越单一化;三是内容分析法是对传播内容的描述,最多能够证明变量之间的相关关系,很少能够揭示因果关系;四是传统的编码分类及编码过程的主观化过强,内在效度不高。

(三)古典实验法的局限:只可验证很难创新

古典实验近年来也遇到了一系列问题:一是古典实验执行的难度较大,很难保证实验组与对照组的同质性,很难在现实执行中找到性别、学历和社会经历完全一致的实验组与对照组成员;二是实验法最大的问题是只能验证某一个结论或研究假设,很难进行探索性研究,得出新发现和新理论,这是由其研究范式所决定的;三是古典实验有很多变量是很难解释,实验法最重要的问题是尽可能地控制干扰变量,虽然实验法也在努力控制这些变量,但很多变量是难以控制和解释的;四是实验材料的特制性与实验被试的差异性,使得实验结论很难推及到其他群体。

社群时代新闻传播学研究方法新转向和新范式

(一)新闻传播学研究范式和方法新转向

1. 研究对象的三个转向

一是从属性数据向关系数据转向。属性数据是金字塔社会结构下经验社会研究的基本数据属性假设,随着社交网络的崛起,金字塔社会结构被一定程度的消解,网状的扁平结构出现,这种社会结构不再关注社会行动者个体的先赋属性——性别、年龄、职业、学历等社会统计学意义的特征,关注更多的是关系属性,即社会行动者个体之间的关系,即人们所处的社会网络和社会层级会一定程度上决定人的行为,在方法论上,社会网络分析法开始崛起,成为重要的研究方法论。

二是从巨内容向微内容转向。内容分析法主要用于对新闻报道的编码分类,以职业化的组织生产行为为主要研究对象,而随着社群传播来临,社群内的语义链和聊天记录成为重要的研究对象,在方法论上从内容分析法向词频等社会语义网的手段转向。

三是从个体向社群转向。以往的传播学研究是基于个体为研究对象,主要是将个体看做一种孤立的、原子化的存在,个体之间的关系网是不纳入考察的范围之中;而社群传播时代的来临,个体是以社群化的方式而存在,圈子成为人们获取信息的第一渠道和社会信息的第一落点,圈子甚至超过大众媒介成为“第一媒介”,因此传播学研究对象也逐步向虚拟社群转向,研究社群内部成员的互动仪式链及社会意义建构,尤其是以游戏等为纽带的趣缘社群研究。

2. 研究方法的三个转向

一是数据采集逐步从人工向自动爬虫技术转向。无论是问卷调查、内容分析法还是古典实验法,所有的数据采集均是通过人工的方式来获取的,无论是数据采集周期还是采集成本都相对较高。网络爬虫技术是一种按照一定的规则、自动抓取网络信息的程序或脚本,爬虫技术使得数据爬取越来越自动化,单位数据获取成本和爬取时间也急剧下降,爬取的数据量却呈几何级增长。

二是数据分析逐步从人工向软件或算法转向。问卷调查法、问卷调查法与古典实验法等传统传播学研究手段后期数据处理主要是采用人工数据录入、借助SPSS等数据分析软件进行分析,要求研究者对统计原理必须有相对较高的了解和掌握。社群传播时代数据在爬虫抓取后多被消重聚合进入相关的数据库,在进行数据处理时直接调入数据库不同字段的数据集,借助事先编好的数据处理程序即算法,进行大数据分析,无论是前端的数据录入还是后端的数据处理都借助的是机器算法,更加快捷和规范,一定程度上也降低了编码员录入的错误,提升了数据的信度。

三是数据呈现逐步从图表向可视化转向。传统研究方法的数据处理结果多是以图形(柱状图、折线图等)、表格等方式呈现,多是2维呈现,而随着数据可视化技术的出现,再加上数据处理维度的增加,数据呈现的方式也越来越多元化:一是数据的维度在不断增加,3D呈现也越来越成为主流趋势;二是数据从静态的横断面呈现向历时态的动态层面转变,结合动画技术更加直观具体,符合了感性刺激消费时代的内在需要。

(二)新闻传播学研究新方法与新手段

近年来在传播学研究领域出现了一些新的研究范式和研究转向,总结来看,以上三种研究方法均出现了新变化,相关情况见图1。

图1 传统传播学研究实证方法的新范式与新转向

从上图可以看出,问卷调查法在数据获取方式上逐步向网络数据爬虫转向,利用Python和R语言等进行网络数据爬取,借助这些语言编程算法等,借助社会网络分析法等实现数据的可视化呈现;内容分析法逐步向借助词典技术实现分词,通过词频计算和词云图展现,以及词与词之间共现关系,实现社会语义网的建构、高频词多维尺度分析和知识图谱分析;古典实验法越来越转向借助神经科学与认知科学手段,进行仪器化操作,借助眼动仪、脑电设备与肌电等对人的情绪及心理变动准确捕捉。

1. 社会网络分析

社会网络分析又被称为结构分析,不仅是对关系或结构加以分析的一套技术,还是一种理论方法,社会网络分析学者认为社会学的研究对象应该是社会关系,而非具体的社会个体,因为作为个体的人是多样的,而唯有其关系是相对稳定的。其应用范围越来越广,各学科都有涉及,如对情报分析、知识图谱和学术共同体、国际贸易、职业流动、社会关系网、信息传播网、交通网等,而使用的分析工具无论是开源的还是收费的也越来越多元,目前主要的社会网络分析软件包括UCInet、Pajak、NetTminer、Gephi等如图2。

图2 社会网络分析方法的主要分析参数

2. 语义网络分析(SMA)

社会语义网络又称关系内容分析,采用词语共现的方式来探讨词语间的关系,能够直接反映文本的显义结构和间接反映文本创作者的认知框架。

(1)词频分析

词频分析是使用词典对信息文本进行有效分词,进而根据词的多寡反映创作者的认知与诉求表达。词频分析最早的使用案例是从词汇上的统计来研究《红楼梦》作者的问题,关于《红楼梦》的作者问题一直是红学研究的争议问题,1981年,首届国际《红楼梦》研讨会在美国召开,美国威斯康星大学讲师陈炳藻宣读了《从词汇上的统计论<红楼梦>作者的问题》这篇论文。他从前80回里随机抽取了5回,从后40回里随机抽取3回,比较5个文言虚词的出现频率,发现它们的正相关程度达到78.57%,由此认为前后作者基本是一个人,即曹雪芹,对“后40回作者系高鹗”这一流行看法提出异议。

(2)社会语义网分析

根据社会网络分析的思想,基于词语共现性(co-occurrence)构建语义网络,这里说的共现性主要是在一定的空间内同时出现,一般研究是出现在同一个句子、节、页码等视作一次共现。还有研究者根据认知心理阈值,认为一个人在记忆中只能容纳7±2个“模块”(chunk),也就是说人只能同时加工5—9个意义单位,因此一般将某个词前后出现的5-9个词认定为共现,如图3研究的是唐诗三百首中词语共现形成的社会语义网。

图3  《唐诗三百首》的社会语义网分析

节点的大小代表词频高低,连线的粗细表示两词之间共现的次数,共现次数越多连线越粗。整个图按节点的中心性进行呈现,节点越靠近中心越重要。从上图可以看出唐诗三百首中频度最高的词是何处、春风、芳草、白云、流水、人间和明月,这些都是唐诗三百首中常用的符号;语义网形成了3个子群,每个子集代表着一个唐诗派别,如下面的子群代表的边塞派等。

3. 高频词的聚类分析

高频词的聚类分析是将高频词按照相似程度归于同一群组,将它们的亲疏关系用谱系图的方式表现出来[]。在聚合的不同类别中,同一类别之内的变量彼此的相似度愈高愈好,而不同类别之间变量彼此的相似度愈低愈好。这种分析方法是对文本中高频词亲疏关系的分析,是体现文本中所有高频词的相似性和相异性的分析图谱。

4. 高频词多维尺度分析

高频词的多维尺度分析(Multi-Dimension Analysis,简称MDS)主要通过测量高频词之间的距离来展现数据结构,运用二维或三维空间中高频词所处在的特定位置,来观察高频词之间的平面距离,解到它们之间的相似性或关联度。通过MDS的相关软件绘制的平面图,能够清晰地揭示出数据中的隐藏联系。在多维尺度分析的结果中,被分析的对象呈现点状分布的特点,图中点与点之间的距离代表它们之间的相似程度,同时将相似度高的和关联性高的对象聚集成一个类别,处在中间位置的对象,代表该对象的核心地位。多维尺度绘制出的坐标是战略坐标,它是二维坐标,是以向心度和密度为参数的。

5. 认知神经科学实验法

(1)眼动追踪技术

人们可以通过眼球活动的情况来推测人们的心理认知活动,眼球追踪技术可以记录与揭示刺激物的不同等级(如哪些元素被更早的感知、哪些会推迟感知、哪些停留在外围或者没有被注意)以及接触时间(如刺激物中某个元素被注意的时长)。眼动指标一般包括注视轨迹(Scan Path )、注视热点图(heat map)、兴趣区,还可以输出相关量化的数据,如单一注视时间(single fixation duration)、首次注视时间(first fixation duration)、凝视时间(gaze duration)、总注视时间(total fixation duration)、眼跳(saccade distance)、回视(regression)等。

(2)脑电、肌电与皮肤电分析

生物电现象是生命活动的基本特征之一,大到鲸鱼小到细菌,都有或强或弱的生物电。人脑中有许多的神经细胞在活动着,而呈电器性的变动,我们称之为脑波。脑电测量的基本原理是在不破坏研究对象大脑的前提下对其脑部活动进行成像。分为两大类:一是基于脑电或脑磁信号的脑生理功能成像、记录脑电压在时间维度变化的测量设备;二是基于脑代谢或脑血流变化的脑功能成像,记录脑活动的磁感应变化,具有良好的空间分辨率,。另一个在新媒体研究中使用的精神生理学技术是面部肌电图(Electromyography,EMG)应用电子学仪器记录肌肉静止或收缩时的电活动,及应用电刺激检查神经、肌肉兴奋及传导功能的方法,搜集时一般采用表面导出法,即把电极贴附在皮肤上导出电位的方法,目前很多脑电设备都集纳了搜集EMG的相关导联模块,直接使用即可。

    结 语

传播学从本质上是一门“拿来主义”的学科,其四大奠基人没有一个是本学科的,均是来自其他学科,是一门多学科交叉、渗透的学科,传播学科建立的过程本身就是一场学术圈地运动,包括研究方法体系均具有较强的学科开放性和包容性。随着社群时代来临,新闻传播学研究方法在范式和底层技术架构上正在进行更新迭代发展,新闻传播学是有可能形成自己相对比较独立和与其他学科区隔的研究范式和研究手段的,因为,如何平衡研究方法的学科间性与融合性成为未来新闻传播学研究方法发展的主要问题。

作者简介:李彪,中国人民大学新闻学院副教授、博士生导师,中国人民大学舆论研究所所长,研究方向:传媒经济学、网络舆情。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多