分享

黄鸣奋丨位量:大数据与位置叙事

 叨叨道 2017-05-09


位量:大数据与位置叙事



作者简介




黄鸣奋,男,祖籍福建南安,1952年生于福建安溪,1962年迁居厦门。厦门大学中文系1977级汉语言文学专业学士,1981级中国文学批评史专业硕士。毕业后留校任教,1994年起为中文系教授,2003年起为博士生导师,2005年起为特聘教授。1998-2004年任厦门大学中文系副主任、主任,中国语言文学研究所副所长、所长;2000-2004年任厦门大学人文学院副院长,2004-2008年任厦门大学海外教育学院院长。曾任教育部中文学科指导委员会委员,现为中外文艺理论学会、中国文艺理论学会等多种社团理事或常务理事,中国作家协会等多种学术组织成员,福建省文化产业学会副会长。自1994年起享受国务院专家津贴。文艺学、传播学、戏剧和影视学三个专业的博导。

主要从事文艺心理学、文艺传播学、新媒体和数码艺术理论研究。已主持完成国家社会科学基金课题5项(包括1项重点课题),省部级课题12项;出版个人专著23种、教材2种,发表论文300多篇,合计超过1000万字;主编丛书5套,合著、合编4种;参与获得国家级教学成果二等奖1项(排名第三),为主获得省级教学成果一等奖1项(排名第一);独立获得全国高校人文社科优秀成果专著二等奖1项、三等奖2项,福建省人民政府社科优秀成果奖11项(其中一等奖3项,二等奖6项)。出版有长篇小说《当即宙:鹭岛放飞梦想》(中国文联出版社,2016)。

代表作为《西方数码艺术理论史》(六卷本,学林出版社2011年版,300万字)、《数码艺术潜学科群研究》(四卷本,学林出版社2014年11月版,311万字)。


“位量”作为名词是指位置的数量,作为动词是指对位置进行量化分析,有关位置的数据就是这样产生的。数据来自对客观事物信息的捕获,常用于指未经加工的原始素材。本书将数据理解为有关叙事对象所处位置的信息,特别是可用计算机加以处理的信息。如今,大数据不仅是我们所处时代的热门技术,而且是迅速增长的叙事资源,同时还是通过移动互联网络得以推广的社会服务。它为数据、位置和叙事的彼此结合创造了新机遇,为叙事主体提供了准确定位叙事对象的新条件,同时又进入话语层面而成为叙事及相关研究的新题目。位置叙事是围绕或依托一定自然位置、心理位置和社会位置而进行的叙事。对于大数据与位置叙事的关系,可以从如下角度予以考察:(1)大数据技术不只促进了数据位置化、位置数据化,而且推动了数据叙事化、叙事数据化;(2)大数据资源可用于定位相对于叙事主体而言的奉献对象、描写对象和师法对象;(3)大数据服务提供了按需叙事的新条件,搭建了信息博弈的新舞台,创造了信息崇拜的新神话。


创意的量化支持:大数据技术与位置叙事的渗透


我国古代早就有“美以数取”的观念。宋代苏轼说:“羊豕以为羞,五味以为和,秫稻以为酒,曲糵以作之,天下之所同也。其材同,其水火之齐均,其寒暖燥湿之候一也。而二人为之,则美恶不齐。岂其所以美者不可以数取欤?然古之为方者未尝遗数也。能者即数以得妙,不能者循数以得其略,其出一也。”[1]对这一命题的来龙去脉,徐中玉从创作论的角度做过详细考订。而且,他经常将“数”解释为数据(1980)。[2]如今我们已经进入了大数据时代,位置叙事在移动互联时代由于GPS等基础设施的支持而大行其道。大数据技术的引入,对于位置叙事而言是重要的发展契机。人们可以将大数据用为资源来讲述有关特定位置的故事,可以将大数据用为工具来检测位置叙事的效果,也可以将位置叙事本身纳入大数据范围而使之获得更为广泛的传播。为了揭示大数据与位置叙事的关系,我们首先要对位置与数据、叙事与数据、数据与大数据的关系加以考察。

(一)位置与数据

数据在广义上是指可计算的记录,在狭义上是指计算机化的信息。“数据化意味着我们要从一切太阳底下的事物中汲取信息,甚至包括很多我们以前认为和信息根本搭不上边的事情。比方说,一个人所在的位置、引擎的振动、桥梁的承重等。”[3]人们的自然位置、心理位置和社会位置都可以数据化。自然位置包括生物位置、生理位置、地理位置等。其中,生物位置是通过DNA等检测来判定的,相关数据表明人的谱系状况;生理位置是通过脉搏、心率、血压、血糖等测量来判定的,相关数据主要表明人的身体状况;地理位置是通过经度、纬度、海拔等测量来判定的,相关数据主要表明人的运动状况。心理位置涉及自我意识、个性倾向性、心理特征、心理过程等,通过心理测量来判定,相关数据主要表明人的经验积累、情感状态、行为倾向等。社会位置涉及身份、角色等,主要通过社会调查来了解,相关数据表明人的社会归属、社会倾向、社会认同等。

位置数据化主要是指通过数据的收集与分析来确定某个人的自然位置、心理位置和社会位置。为此,首先必须确定常模、坐标、可视化方式,然后将数据导入上述系统,通过比对确定并显示相关当事人所处的位置。作为位置数据化的延伸,产生了叙事化位置数据和位置化叙事数据。前者来自叙事化位置向可计算记录的转变。例如,我们可以统计特定城市在特定时段所拥有的书场、剧院、影院的数量和地点,由此揭示专门化叙事场所的分布及其发展。后者来自位置化叙事向可计算记录的转变。例如,我们可以统计特定时段、特定媒体所报道的地域性新闻事件的空间分布,由此揭示相应国家和地区在该媒体新闻报道中所获得的关注度。

存在与位置数据化相反相成的数据位置化。后者是指将所拥有的数据定位于相应的自然位置、心理位置和社会位置,以揭示其含义与价值。由此产生了数据化叙事位置、叙事化数据位置。前者通过数据呈现出叙事所赖以进行的位置的基本情况,如一部电影上线之后在哪些影院中播出等。后者指有关叙事的数据(除叙事本身所包含或转化而来的数据之外,还包括电影市场数据、电视剧收视数据等)所处的位置,如影业公司调研部门、政府文化市场管理部门等相关机构的存储空间等。

(二)叙事与数据

叙事可以通过量化而转变为数据。所谓叙事数据化,包括三层意思:(1)叙述行为数据化,作为集合的叙述者、传播者、受叙者既然可以计算其规模、分析其位置,那么,就都可以转化为数据,由此建立叙述数据库。(2)所叙之事数据化,指所叙述的事件通过定性、定量分析转化为数据,由此建立事件数据库。(3)叙事互动数据化,指叙事方式、叙事环境和叙事机制通过量化转变为数据,由此建立动态数据库。倘若掌握了这些数据,人们便可以知道叙述时间、叙述空间等要素的具体变化。

叙事数据化是将叙事相关信息转变为数据的过程。作为其延伸,位置叙事数据化指的是将和位置有关的叙述行为、所叙之事、叙事动态等信息都纳入可计算记录的轨道。如果我们将地域文学当成位置叙事的个案而推进其数据化的话,那么,就必须将地域文学的创作者、传播者、接受者都纳入叙述行为的量化范围,将地域文学的表现手段、基本内容和逻辑分类都纳入所叙之事的量化范围,将地域文学的讲述方式、所在环境和发展机制都纳入叙事动态的量化范围。叙事位置数据化是指将和叙事相关的自然环境、心理环境和社会环境都当成可计算记录加以处理。例如,我们可以通过数据化了解明清小说所叙述的事件发生于哪些城市和乡村,叙述者处于什么样的心理氛围,叙事过程和当时的社会变迁之间存在什么关系。

存在与叙事数据化相反相成的过程,即数据叙事化。后者指用数据讲故事。数据虽不是行为,却可以表明行为的趋势;数据虽不是事件,却可以成为事件的组成部分;数据虽不是决策,却可以成为决策的根据。沿着数据叙事化的思路,可以形成数据库叙事。在位置的意义上,数据叙事化包括位置数据叙事化、数据位置叙事化。前者是指应用位置数据讲故事。例如,子夜时分某个城市有多少人已经有多少人安然入睡,多少人还在享受夜生活,另外还有多少人在为上述这些人服务,这些数据都可以纳入相应的城市叙事之中。后者是指利用对数据所在位置的分析讲故事。例如,特定时段某个企业有多少数据保存于服务器、多少数据保存于个人电脑、多少数据保存于纸质文件,这些数据如何在不同平台之间流动,这类流动如何反映了企业的组织结构、内外关系和运营过程,牵涉到多少员工的处境和经历,诸如此类的分析都可以纳入相应的企业叙事之中。人们可以通过叙事呈现数据所处位置的基本情况,如以故事形式讲述地理数据怎样被搜集、被保存、被加密、被窃取、被追踪、被缴获,等等。聚焦维基解密网站的美国纪录片《第五阶层》(The Fifth Estate,2013)中就有不少这样的镜头。

(三)数据与大数据

广义数据在人类历史上由来已久,伴随着计算技术的发展而发展。狭义数据在20世纪中叶以来经历了爆炸性增长,从数据库和联机分析阶段、数据仓库与数据挖掘阶段发展到大数据技术阶段。除数据量(Volume)大之外,大数据还有高速率(Velocity)、多类型(Variety)等特点。[4]相关范畴有着眼于数据运营重要性的价值(Value)、着眼于数据质量的可验证性(Verification)、着眼于数据格式的可变性(Variability)、着眼于数据可信度的真实性(Veracity)、着眼于可就近获取资源的邻近性(Vicinity)[5],等等。

从数据时代到大数据时代的转变不仅是技术的进步,而且是范式的转变。数据时代的到来是以计算机革命为标志的。自此,从国民经济、政治角逐到整个社会生活都被纳入了信息化、数据化的轨道。大数据时代的到来是以依靠全球信息基础设施整合无处不在的传感器、处理器和效应器为标志的。它具有数据获取连续化、数据处理精细化、数据呈现灵活化等特点。在其倡导者看来,大数据已经不仅是信息的来源,而且是知识的来源、真相的来源,甚至是真理的来源。因此,科学研究不再是为检验理论假设去搜集、整理数据,而是致力于从穷举性、动态性、凌乱性数据中去寻找知识、真相与真理。

随着大数据时代的到来,位置数据化与数据位置化都进入了新的发展阶段。凭借大数据技术,人们可以即时追踪和分析大规模群体所处的自然位置、心理位置和社会位置,为企业营销、在线教育以至于全球治理提供参考。与此同时,海量数据成为各种社会组织(甚至是有条件的个人)所重视、交换、买卖、共享的对象,在各种存储设备之间流动,为不同目标所利用,不断产生新的价值。叙事数据化和数据叙事化也都因为大数据时代的到来而经历了质的飞跃。在个人、组织、国家以至于国家共同体等层面所曾有过的叙事被作为历史大数据的组成部分,正在进行的叙事被作为实时大数据的组织部分,即将进行的叙事被作为预测大数据的组成部分,都纳入了大数据战略的理论和实践。与此同时,大数据叙事正日益频繁地出现在新闻、科普、艺术等领域,言之凿凿地描绘现实生活中的大潮流和新趋势,高度雄辩地宣传科学技术的发明和贡献,并充满幻想地激励对赛伯世界的探索热情。

因此,大数据技术与位置叙事的相互渗透是移动互联时代值得高度关注的现象。随着这种技术的发展,人们在自然空间、心理空间和社会空间穿行时所留下的任何痕迹都可能被感知、被记录、被统计与分析,转化成为位置叙事可利用的资料。反过来,位置叙事将大数据技术自身的定位纳入自己的话语,讲述它从丑小鸭变成天鹅的经历,预测它作为吉祥鸟或恶禽飞入自然空间、心理空间和社会空间的各种可能。大数据技术也被应用于历史研究。例如,在日本,德川幕府统治期间(1603-1867)史称“江户时代”,流行歌舞伎。如今,学者靖子河旱田(Yasuko Kawahata)等人运用数学模型对它加以研究,涉及当红艺人的计算和测量。为此,他们广泛搜集了当时浮世绘、诗歌、俳句、书籍等。用于研究江户时代潮流的数据库收录了由博物馆与个人所拥有、保存于日本和其他国家的大约63万种出版物。其论文《运用冲击现象数学模式分析19世纪“大数据”的可能性》(2013)显示出1849-1855年间与第九代市川团十郎(Ichikawa Danjuro IX,1838–1903)相关的文献数量的变化。[6]

从上述认识出发,我们将数据(乃至于大数据)理解为创意的量化支持。诚然,正如《文汇报》记者范昕等人所说,“大数据算不出思维创意。”[7]不过,数据(特别是大数据)确实对创意可以起支持作用。对具体作品而言,几乎任何成规模的创作都必须考虑篇幅、用料、成本、效益等量化因素。不仅如此,数据可视化早已成为创意的重要途径。对创意产业而言,有数据才有依据。数据产业所取得的重大突破,可能通过技术普及、观念变革等对创意产业施加影响,如打造新型创意平台、开拓受众市场、调整产业布局、引导创意方向、提高创意产品转化率等。


创意的量化依据:大数据资源与叙事对象的定位


自古以来,叙事主体若要对叙事对象加以定位的话,就必须搜集相关信息。有关听者、读者、观众、市场等信息是定位奉献对象的根据,有关生活原型、社会风气、时代潮流等信息是定位描写对象的根据,有关艺术惯例、艺术传统、艺术权威等信息是定位师法对象的根据。这些信息和定位既相互区分,又相互联系,构成了叙事主体与叙事对象之间的互动态势。大数据资源可以为上述定位提供有力的支持。

(一)大数据与奉献对象的定位

叙事主体与奉献对象的关系至少涉及如下问题:人们给谁讲故事(或者说故事讲给谁听)?叙述者如何为自己设定受叙者?这种设定的根据是什么?现实受叙者的期待如何转变成为叙述者的动力?预定受叙者如何引导叙述者的思路?听故事的人产生了什么心理反应?这种反应如何转变成为反馈而对叙述者产生正强化(或负强化)?在大众传播条件下,如何尽可能扩大接受者的范围、博得好评而非差评?等等。

叙事主体对奉献对象的定位虽然是主观的,但仍有其客观依据,通过调查而获得的数据就是这种依据之一。关于图书读者、电影观众、电视用户等的调查已经在大众媒体中司空见惯。大数据将上述调查转移到全球信息基础设施的平台上,利用网络来追踪社会动态,从而为叙事主体定位奉献对象创造了新的可能性。目前,叙事信息检索正经历由系统中心视角向用户中心视角的转变。在这样的背景下,人们强调多模式推荐,以便超越单一文本检索、网络检索或数据协同过滤的局限。业界提出将叙事内容、叙事背景及用户背景结合起来的推荐算法,整合了地理空间、心理空间和社会空间相似性的观念。它可以运用从社交网络推导出的叙事接受活动标准化数据集,以高级技术析取出故事特性和作为背景的网络特性,将用户背景要素、地理定位信息加入协同过滤系统之中。

在国外,由流媒体视频网站奈飞(Netflix)制作的网络剧《纸牌屋》被作为以大数据分析技术制胜的范例。国内引入大数据分析而制作的有电影《小时代》(2013)、网络动漫《十万个冷笑话》(2014)等。据说,《北京遇上西雅图》(2013)、《中国合伙人》(2013)、《致我们终将逝去的青春》(2016)等影片的成功,都离不开大数据在背后的支持。大数据似乎昭示预见未来的新思维,证明海量数据可以掘金、营销在艺术行业占有关键地位。在理论上,它获得了“受众本位”理念、接受美学的支持,在实践中则与第四次工业革命所促成的定制化相呼应,诱发了打造“全民电影”“精准电影”“定制电影”等憧憬,使小公司得以玩转大市场,“小时代”得以演绎大叙事。

(二)大数据与描写对象的定位

叙事主体与描写对象的关系问题至少包含如下内容:人们如何在现实生活中与其他人交往,将由此发生的事件作为叙述内容,并将由此把握的生活原型转变成所叙之人?人们如何通过对事件和人物的描述表达自己对现实的认识和诉求?社会发展的整体趋势如何通过具体的描述对象表现出来?叙述者对事件和人物进行了哪些加工?由此导致所叙之事与本来之事、所叙之人与本然之人相比出现了哪些变化?上述变化和不同领域(如文学、新闻、历史等)的叙事方式存在什么样的关系?等等。

叙事主体对于描写对象的定位过去主要依靠自身的社会阅历,有时也参照既有的理论模式和/或调查数据。数据本身不是事件,但仍然可以被结合进事件之中,成为事件的组成部分而被叙述。大数据进而追求成为叙事的基点。以地理大数据而论,将它们作为叙事基点的做法目前在新闻领域比较常见。根据中国人民大学方洁等的看法,地理数据可以分为自然地理数据和人文地理数据。具体到新闻报道中,常见的地理数据包括结构化的地图、地理坐标、关系网络以及需借助大数据技术挖掘呈现的运动轨迹、地点热度等,由此产生了相应种类的数据新闻。由于电子地图具有可放缩性、可追溯性、点面结合,运用地理信息的数据新闻具有以下优势:拓展了报道的时空跨度,运用交互设计赋予用户个性化的数据,可从地理关系构建报道内在的逻辑;易于获取,精确性高;可为日常生活和政府决策提供参考。[8]根据浙江大学李岩等人的研究,为了抓住人们的注意力,数据新闻依然在讲述新闻故事,但发展出了信息爆炸时代能更好地处理、传送与接收信息的模型和工具,如数据挖掘、数据分析、可视化、交互应用等,从而将传统的新闻敏感和有说服力、感染力的叙事能力与海量数据结合,创造了新的可能。数据新闻为数据驱动,以可视化的方式讲述故事,复杂的故事也能变得清晰。数据新闻增强了互动性,讲述多维故事,帮助读者探索新闻相关信息,且鼓励读者参与到创作和评价新闻故事的过程中。参与、互动、开源成为数据新闻故事的新特征:这不是传统讲述的集中化的故事,而是去中心化的故事。[9]

数据当然也不是人格,但仍然可以成为叙事主体塑造人物的根据。英国电视短剧《黑镜2:马上回来》(Black Mirror 2:Be Right Back,2013)关于利用大数据创造再生人的幻想,就是以此为根据的。正如南京艺术学院卞波等所说,影片提供了如下假设:如果现在有一种方法,可以采集到女主人公和离世男友 Ash 相处时候的所有信息,就能再造一个和 Ash 一模一样的仿真人。[10]不仅如此,大数据还作为观念而引导叙述方式的转变。如中国传媒大学田亦洲所言,法国电影《无姓之人》(Mr. Nobody,2010)叙事结构与大数据所导致的三个重大思维转变形成了某种暗合:(1)对于多种可能性的探索:“分叉之分叉”;(2)对于混沌与无序的呈现:网状、碎片化的结构样态;(3)对于相关关系的展示:以相似性意象与细节作为连接点。[11]

大数据与师法对象的定位

叙事主体与师法对象的关系问题至少包含如下内容:就讲故事而言,先行者对后来者产生了什么样的影响?后来者为什么将某些先行者当成自己模仿、戏仿或反模仿的榜样?这种模仿、戏仿或反模仿究竟是如何发生和实现的?怎样才能准确判定抄袭、剽窃与侵权?后来者是否意识到并公开承认自己在叙事手法、叙事风格等方面对先行者的取法与师承?上述取法与师承在客观上产生了什么影响,是束缚了新思路的开拓,还是促进了新成就的获得?等等。

在大数据时代到来之前,人们对上述问题的分析局限于个案解剖、抽样调查、专家评估、权威裁决等做法。大数据技术的引入创造了这样的可能性:将对叙事传播与接受的调查从局限于个别媒体扩展到跨平台动态感知,从局限于短期抽样扩展到全体用户视听行为数据的长时间、大规模积累;追踪先行者的叙事产生影响的全过程,揭示后来者叙事形成发展的全过程,考察上述两类过程彼此交织的轨迹,从而实现叙事雷同检测(或叙事创新检测)。不仅如此,如果我们将人类迄今为止所已经创造的叙事都转化成为数据的话,那么,可以进而梳理特定故事在世界范围内的流变,提炼跨文化叙事真正意义上的母题,建设全球意义上的叙事网络,并使之成为语义网的重要组成部分。

在比较文学领域,关于叙事主体和师法对象之关系的研究是沿着三种基本取向进行的:影响研究,将先行者对后来者所产生的影响当成重点;平行研究,主要考察没有交叉轨迹而又存在相似性的作品之间的关系;类型研究,致力于提炼相关叙事所包含的某种模式。大数据技术固然可以推进包含因果关系的影响研究,但它的特长或要旨是在揭示海量信息的相关关系方面,因此对平行研究和类型研究大有裨益。

上文关于依托大数据资源对奉献对象、描写对象、师法对象加以定位的分析不是彼此孤立的。暨南大学刘涛已经指出:大数据的基本功能是对模式与规律的发现以及对未来趋势的预测。基于大数据思维的电影内容生产机制可以还原为七大用户数据(用户基本特征数据、用户社交生成数据、用户线上互动数据、用户消费记录数据、用户Web公共数据、用户线下行为数据、用户地理位置数据)与六大电影内容元素(故事、影像、导演、表演、声音和剪辑)之间的“相关关系”的发现与预测过程。[12]如果说用户数据维度关系到奉献对象、电影内容元素维度关系到描写对象的话,我们可以再加上包含相关作品比较、选题审核、投资决策、内容开发、剧本选择、人员选择、拍摄制作、市场营销、终端放映等在内的另一维度(关系到师法对象),由此构成电影叙事对象的三维坐标。这一坐标系原则上也适用于其他叙事领域。

综上所述,大数据资源通过对叙事对象的定位为创意提供了量化依据。必须指出:大数据服务以全球信息基础设施为依托,后者的特点之一是交互性。这意味着数据发送者和数据接受者、服务提供者和服务利用者的身份可以灵活转变。在这样的背景下,叙事主体和叙事对象(含奉献对象、描写对象和师法对象)之间的区分仅仅是相对的。它们不仅彼此定位,而且共同为大数据技术、大数据资源、大数据平台、大数据服务等所定位。例如,叙事主体若企图通过在线交往来搜集其他人的数据,就不可避免地使自己在赛伯空间中的行动和经历成为其他人可以搜集的数据、因而朝叙事对象转变,如果有大数据记录支持的话。他们正是以留下自己的踪迹为代价,换取了搜集其他人数据、了解其他人故事的机会。反过来,任何原先作为接受者、故事原型或借鉴对象而出现的现实之人,都可以通过大数据服务而使自己成为信息来源,从而获得向叙事主体转变的可能性。



创意的量化前景:大数据观念与位置叙事的发展


大数据不只是某种受青睐的技术、受重视的资源,甚至也不只是某种正在迅速扩展的平台、正在大量吸金的服务,而且是一种扑面而来的潮流、一种渗入思维的观念。2013年被称为“大数据元年”。从那时以来,大数据作为热门话语不断升温。尽管如此,作为警世之言的大数据批判也随之兴起。在这样的背景下,有必要对大数据自身位置及其和位置叙事发展的关系加以审视。

(一)大数据是按需叙事的新条件

人类传播的主导形态经历了以人际传播、大众传播到网际传播的转变。人际传播以面对面交流为出发点,按照差序格局在社会上扩展;大众传播以大众媒体为出发点,通过机械复制在社会上扩展;网际传播以全球信息基础设施为出发点,通过移动互联在社会上扩展。信息是根据不确定性的消除来定义的,正如熵是由确定性的消除来定义的那样。在人际传播占主导地位的时代,确定性最重要的根据之一是“天不变道亦不变”的元命题。在大众传播占主导地位的时代,确定性最重要的根据之一是有关社会进步的元叙事。在网际传播时代,确定性最重要的根据之一是有关大数据的元观念——社会需求是可以通过大数据分析的,社会运动是可以通过大数据描述的,社会发展是可以通过大数据预测的。

不论作为技术或作为观念,大数据都只有相对短暂的历史,尽管如此,它所代表的通过计算定位、通过记录定位、通过集合定位的传统却渊源有自。在叙事领域,叙事主体早就必须计算来听自己讲故事的有多少人,场地有多大,时间有多长。如果要对听者收费的话,还必须计算成本、价格、利润率等。所谓“按需叙事”(narration on demand)指的是根据接受者的需要来讲故事、生产和传播叙事产品。这里所说的“接受者”如果是个人的话,那么,需要人际传播的支持;如果是大众的话,需要大众传播来支持;如果是“全球村”居民的话,需要网际传播的支持。当前以互联网、移动通信为平台的网络文学、录音故事和网络剧可以视为后者的雏形。它们或者作为点播资源,局限于情节外交互;或者作为参与叙事,进入了情节内交互。在人际传播条件下,叙述者面临的是数量极其有限、范围相对确定的受叙者。因此,可以相对集中地揣测其需要、特征、处境,以便投其所好。在大众传播条件下,受叙者的范围大为扩展、心理不确定性相应增加,因此,叙述者往往需要第三方(如咨询公司)介入调查,以便为自己提供参考系。在网际传播条件下,受叙者的身份更为复杂、心态更常变化。因此,叙述者可能不仅需要第三方的帮助,而且需要专门软件来为自己提供有针对性的大数据。

基于大规模个性化定制的按需叙事既是位置叙事的美好远景,又是已现雏形的现实运动。通过大数据分析为奉献对象定位,就是朝上述方向的前进的重要一步。不过,必须指出:按需叙事具有避免无的放矢的优点,但也存在随波逐流的缺点。就此而言,即使大数据分析极其准确、及时,以之为根据而制作的叙事产品虽然有希望获得一定的成功,却未必就能具备很高的水准、保有恒久的价值。

(二)大数据是信息博弈的新舞台

早在20世纪中叶,信息产业就被当成国民经济的龙头。21世纪勃兴的大数据技术既顺应了通过信息化带动国民经济发展的历史要求,又给相关产业带来无穷的机遇和丰厚的利润。尽管如此,大数据时代依然是风险时代:(1)在四处遍布传感器的社会中,全景监视达到了传统监视所无法企及的缜密程度,用“无条件怀疑”侵蚀并威胁公民的隐私权,使社会控制变得无孔不入;(2)由传感器自动搜集的数据由计算机自动处理,这种自动化操作一旦出错,会给无辜的人们带来巨大的伤害;(3)社会上所存在的各种利益集团争相采用大数据技术来对付别人,这不仅无助于解决必须依靠共同努力才能奏效的问题,而且加剧了矛盾冲突;(4)那些以“用户预测”“人生挖掘”(life mining)等为己任的个人和组织(如数据公司、社交网站等)不仅将自己的利益整合到相关算法、软件和技术的开发中,而且将所收集的元数据打包出售,并未顾及这样做所可能带来的严重后果,如电信诈骗因此得手等。上述原因瓦解社会信任、社会程序,增加社会怀疑、社会紧张,说明大数据崇拜的消极影响。

在这样的历史背景下,不仅监视与反监视、预测和反预测、控制与反控制成为大数据叙事的重要来源,重建信任和秩序也已经成为大数据叙事的重要主题。就此而言,大数据开拓了新的数字公共领域(如相关在线公共论坛),呼唤着新的政治行动,正为位置叙事提供新的素材、新的主题、新的故事、新的情节、新的悬念。从描写对象的角度看,位置叙事本来就关注技术进步给人类自然位置、心理位置和社会位置所带来的变化,将它作为塑造人物、讲述故事的出发点。不论作为行业,或者是作为遍及整个社会的信息化,大数据都可以成为叙事灵感的触发点。

(三)大数据是科技神话的新形态

大数据是由来已久的科技崇拜的新发展。大数据之所以被当成神器,首先是因为它以当代信息科技为依托,比传统算命卜卦或单靠拍脑袋的预测学、从综述新闻入手谈浪潮的未来学显得靠谱;其次是因为它打出“海量”的牌子,宣扬“全本”的特点,让人觉得比传统数据分析更可靠、更先进、更全面。大数据鼓吹者进而许诺形成“历史性全知”,亦即宣称数据公司、数据分析师有可能洞悉过去、现在与未来。在言过其实的相关话语中,大数据从科技理性向拜物教转变,成为当代神话的新形态。我们称之为“大数据叙事神话”。

我们之所以说大数据在某些情况下仅仅是当代神话,至少有如下原因:(1)海量数据相对价值的下降。虽然数量总量以令人惊异的速度增长,但单位数据对人类思维的影响却大幅度下降(在考虑很多数据属于无用的情况下尤其如此),因此海量数据的整体价值未必就是“海量”。(2)“全本”在不少情况下属于不可能实现的要求。不论数据挖掘的范围如何之广,总是有些情况不在其列。例如,对一部电影的票房预测来说,要想进行基于“全本”的研究,必须假定所进行的调查已经涵盖了潜在的所有因素,这是很难做到的。因此,所谓大数据预测未必就能成功。电影《黄金时代》(2014)票房惨败,就是大数据失算之注解。即使是被作为大数据成功预测之范例的电视剧《纸牌屋》,也存在争议。根据记者金姬的考察,该剧的诞生源自美国独立制片公司(MRC)一名实习生的推荐,和大数据没有半毛钱关系。[13]果真如此的话,大数据有时只是营销的噱头。(3)“历史性全知”失范的可能性。大数据技术由人开发,大数据分析由人进行,不论数据公司或数据分析师,都可能是利益主体,所得出的结论未必客观。姑且不说有意造假的现象难以根本消除,即使是非动机性偏见也可能影响认知的可靠性。因此,排除“脏数据”或“数据噪声”是一项重要任务。

解铃还须系铃人。对于大数据属性、价值和归宿的判定,很可能需要大数据本身的支持。在师法对象的意义上,不论是大数据技术的开发者或大数据服务的使用者,都需要从自身的经历中学习,同时借鉴相关的经验教训。“实践是最好的老师。”在位置叙事的意义上,这句话意味着唯有通过为自身定位的实践才能找到自己的合适位置,并与他人分享。如果说有什么“大数据位置叙事”的话,那么,这不仅是指用大数据来进行关于位置的叙事,也不仅是指靠大数据来为叙事定位,而且还是指大数据为自己寻找定位的经历与事件,其总和构成了大数据的历史和明天。它无疑是范围更为广阔的社会信息化的组成部分,所讲述的是以自然进化为主导的人类向以人为进化为主导的后人类转变的故事。如果人们利用大数据分析来改造自身,那可能就是后人类社会到来的标志。因此,必须从全球性、历史性视角看待大数据所带来的伦理问题。

由此看来,尽管大数据对于位置叙事的发展具备不可估量的价值,但它难以一劳永逸、一通百通地解决位置叙事的创意问题。在许多情况下,大数据为我们提供的仅仅是某种似确定性,与其说是让我们可以亦步亦趋地跟着它所显示的趋势去开拓创意产业,还不如说是坚定了我们发展创意产业的信心而已。撇开大数据本身的可靠性不论,真正有价值的创意不乏“妙在数外”(即难以应用纯粹的量化来产生或评价)的成分,真正有前途的创意产业也不乏并非纯粹靠数据统计来概括的运营模式。本节开头所引苏轼之言“能者即数以得妙,不能者循数以得其略”确实很辩证:真正有本事的人是通过接触“数”来臻于化境,没本事人的只是根据数据得其皮毛。


注释

[1][宋]苏轼:《大悲阁记》,《苏文忠公全集》东坡集卷三十一,明成化本,第328页。

[2]徐中玉:《苏轼创作思想中的数学观念》,《文学遗产》1980年第3期,第45-53页。

[3](美)迈尔-舍恩伯格、库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,杭州:浙江人民出版社2013年版,第20页。

[4] Laney,Douglas. 3D Data Management: Controlling Data Volume, Velocity, and Variety.Meta Group, February 6.2001.

[5]谭磊:《大数据挖掘》,北京:电子工业出版社2013年版,第5页。

[6] Kawahata,Yasuko, Etsuo Genda, Akira Ishii.Possibility of Analysis of 'Big Data' of Kabuki Play in 19th Century Using the Mathematical Model of Hit Phenomena. Advances in Computer Entertainment.Lecture Notes in Computer Science,Vol. 8253, 2013, pp.656-659.

[7] 范昕、张祯希:《大数据算不出思维创意》,《文汇报》2013年11月24日,第1版。

[8] 方洁、胡杨:《地理数据叙事:数据新闻报道的新趋势》,《新闻与写作》2016年第1期,第86-89页。

[9] 李岩、李赛可:《数据新闻:“讲一个好故事”》,《浙江大学学报》(人文社会科学版)2015年第6期,第125页。

[10] 卞波、曹蔚:《大数据对新媒体图景的展示——以英国电视短剧〈黑镜2:马上回来〉为例》,《艺术百家》2014年S1期,第237-239页。

[11] 田亦洲:《大数据思维影响下的电影美学新趋向——以大数据为特征的叙事结构》,《当代电影》2015年第2期,第154-156页。

[12] 刘涛:《大数据思维与电影内容生产的数据化启示》,《当代电影》2014年第6期,第9-14页。

[13] 金姬:《大数据只是噱头》,《新民周刊》2014年第9期,第56-57页。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多