《社会学评论》| 何祎金：解锁技术嵌入的社会性与数字麻烦——大数据时代的社会学想象力

花间挹香 2021-12-28

展开全文

内容提要:大数据研究在社会学领域被视为统计方法或者定量研究的新趋势与有前景的新方向。但是，信息技术嵌入的数字生活形成了新的“社会性”，主体的存在与实践方式发生了很大的变化，在被赋予更多选择和更大延展性的同时也产生了新的“数字麻烦”。这些新情境同样对社会学的理论研究提出了迫切要求。在当代万物皆可数据的日常生活中，为了避免在大数据时代迷航，我们亟需一种新的社会学想象力，来批判性地理解和“解锁”我们身处的时代与数字生活。

关键词:大数据;社会学想象力;社会性;算法;数字麻烦

在过去的半个多世纪里，米尔斯的《社会学的想象力》已经成为社会学史上的经典，被翻译成多种文字出版，影响了不同文化和社会情境中的社会学研究者。想象力的经久不衰一方面是其学术深度与价值的体现，另一方面，在理论旅行的过程中，想象力不断被阐释和再阐释，并被不同时代和地区的学者赋予新的意涵与价值。

进入21世纪，以“新”为前缀对社会学想象力进行重构或者续写成为学者的学术目标(Fuller，2006;Pyyhtinen，2016)。我们今天面对的世界与米尔斯生活的时代相比，已经不可同日而语。在过去的半个多世纪里，不仅历史进程被重塑，我们的社会生活也因为科技文化的发展和嵌入而发生了巨变。作为一门与社会发展密切关联的学科，社会学也在时代变迁的背景中不断完成自我的发展与重构，并拓展了想象力在当代的理论疆域与学术生命力。

在大数据时代，我们在日常生活中遭遇的“个人麻烦”，置身其中的“社会结构”，以及面对的“社会问题”，越来越具有数字化的特征，这些新变化也为如何实践社会学想象力提出了问题。我们亟需一种新的想象力，来理解和“解锁”(unlocking)我们身处的时代与数字生活。本文以“数字麻烦”来概括个体在当代大数据情境中容易遭遇的问题，强调对其理解与转化，批判性地把握和解读技术嵌入社会生活所形成的“社会性”是实践社会学想象力的关键。社会学的大数据研究，不仅需要研究方法与分析技术上的创新与精进，同时也对社会学的理论研究提出了迫切要求。

随着信息通信技术的高速发展，以及它在日常生活中的高度嵌入，传统社会学理论固有的范式需要应对技术革新及其后果带来的挑战。我们面对的是一种崭新的“社会性”——网络社会的兴起以及社会生活的数据化转型(Mayer-Schounberger&Cukier，2013;van Dijck，2014)，不仅主体的存在和表现方式发生了较大的变化，主体的身份也在虚拟与现实交织的空间中被赋予更大和更灵活的延展性。尽管我们享受数字生活带来的便利，当我们行动衍生的数据被不同公司或者机构根据特定的算法分类、排序和组织，完成我们在服务器节点中“数据主体”(data subject)(EU，2016)或者“算法身份”(algorithmic identity)(Cheney-Lippold，2011)的建构，并在现实生活中造成实际后果的时候，我们并不了解背后技术运行的机制，以及可能存在的风险，甚至对这一过程完全不知情。在数据失控的“黑箱社会”(Pasquale，2015)，存在“技术无意识”(Clough，2000;Thrift,2005)的状态。黑箱社会的隐喻加大了在新社会情境下实践想象力的难度，但这也是21世纪的社会学无法回避的责任与义务。

一、万物皆可数据：

社会学想象力的当代拓展与新挑战

如同互联网应用和软件产品的更新与升级，社会学想象力也是一个不断完成版本升级的理论产品。这种更新升级包含了两种方法:第一种方法采取历史的路径，在历史情境中解读米尔斯的理论，它纠正可能存在的理论误读，丰富我们对想象力的当代理解;第二种方法结合新的社会现实与状况，强调更新想象力的必要，以把握和理解当前社会的新情境与新问题。万物皆可数据(datafication of everything)所形成的数据洪流，对新情境下实践社会学想象力提出了要求。

想象力的当代拓展

后米尔斯时代的社会学想象力继承和拓展了米尔斯留下的学术遗产。史蒂夫·福勒(Steve Fuller)的新社会学想象力指出了这门学科在当代面临的新议题，尤其是来自生物自由主义(bioliberalism)的挑战(Fuller，2006)。当代社会学可以通过重归古典社会学理论中被隐藏的生物学传统来介入当代公共议题的讨论。玛瑞纳斯·奥萨瓦德(Marinus Ossewaarde)则认为新兴起的“新福利与战争国家”(The New Welfare-Warfare state)作为后冷战时代的基本情境，它与想象力诞生的时代存在巨大差异(Ossewaarde，2011)。新自由主义、全球资本主义、生物技术、优生学和种族政策反映了社会前所未有的结构性变化，它们对想象力的升级提出了要求。在一定程度上，想象力的拓展和更新并不是社会学理论内在逻辑发展演绎的结果，它更多地来自对外部诸种挑战与思潮的回应。

在方法论维度，历史上想象力对“抽象经验主义”的批评容易被贴上反实证主义的标签，但是想象力的当代拓展面临学科发展的新情境。实证主义与人文主义方法论传统之间的范式战争趋于缓和，方法间的融合与创新代表了新发展方向(Bryman，2008)。不仅要承认社会学内部的异质性，更需要将其转变为实践创新学科性和混合方法的财富(Mjoset，2013)。走出米尔斯和方法之争，避免陷入二元论陷阱，寻求方法之间的尊重、包容与取长补短，以实现对当代社会学想象力的完整理解(陈云松，2018)。

因为想象力蕴含着强烈的批判属性，这一经典作为米尔斯的“政治纲领”(赵立玮，2016)，依然可以运用到对当代社会学的学科反思和自省中去。吉登斯将米尔斯的想象力扩容为整合了历史、人类学和批判的三重感知力，当代社会学需要通过历史比较分析来理解现代社会和生活，以人类学感知力来理解西方文明之外的多元社会，并通过批判现有形式的社会来探寻未来社会的可能(Giddens，1986:16-22)。三重感知力的理论视野溢出了西方和美国的地理区域，它不仅批判了古典社会学中欧洲中心主义的历史遗产，还带有“修正”其中误读和偏见的理论意涵。

此外，米尔斯对自己所处时代社会学的诊断与批判，背后的公共价值成为当代社会学迈向“有机公共社会学”的重要象征资源。在布若维等人所提议的新知识计划中，需要将社会学想象力升级为具有行动特征的政治想象力，从米尔斯呼吁的社会学为公众而写作转变为走出精致的象牙塔，与公众站在一起(Burawoy，2007;Ossewaarde，2007)。

吉登斯、布若维和福勒等学者对想象力的升级与改写，是对各自所处时代重要问题的社会学反思与回应。在21世纪，随着网络社会和数字生活的兴起，汹涌而来的数据洪流代表了一种无法回避的全新社会情境。我们正在经历一场数据改变了生活、工作和思维的革命(Kitchin，2014)，亟需一种新的想象力来批判性地理解我们身处的时代和数字生活。

数据革命的新挑战

在万物皆可数据的世界，信息技术通过量化的方式获取万物的信息，并挖掘其中隐藏的潜在价值。在这个过程中，世界以及我们的社会关系都被量化了(Mayer-Schounberger&Cukier，2013:79)。与此同时，各种各样的算法和程序对“我们”量化数据的分析和处理，会在日常生活中带来现实后果，我们所遭遇的个人困扰和麻烦也越来越具有数字化的特征。

在米尔斯的原著中，互联网这一已经彻底重构了日常生活的“未来事物”尚未现身。互联网的雏形阿帕网(ARPAnet)在1969年出现，时间上已是《社会学的想象力》首版的十年之后，但这并不意味着想象力与今天的大数据时代缺少关联。在纪念米尔斯逝世五十周年的文章中，尼古拉斯·甘恩(Nicholas Gane)和赖斯·贝克(Les Back)指出，想象力在我们的同时代并不是一种过时的理论话语(Gane&Back，2012)。社会学在米尔斯这里就像一个导航工具，想象力的心智品质使个体不陷入迷失与虚妄，它提升了连接个人经验与广阔社会力量的批判感知力。并且，社会学想象力所赋予的感知力并不会止步不前地固化为某种特定的范式或者研究标准，而只会不断地根据现实环境与当前的问题进行调整与重塑，这也是米尔斯带给未来的礼物。

对于正在发生的数据革命，社会学并非处于完全免疫或者无视的情况，它最先在方法领域引起了学者的关注。早在大数据概念流行之前，已经有社会学家关注数据洪流现象带来的挑战，并担忧社会学固有的抽样调查和质性研究方法无力应对这一新兴的社会现象。麦克·萨维奇(Mike Savage)和罗杰·布若斯(Roger Burrows)注意到，社会数据在日常生活中被大量生产出来，并不需要刻意地进行收集，它们只是商业机构或者政府组织运行的衍生结果。组织机构对数据的分析运用了先进的技术工具，也更有能力处理大规模的数据，且并不依赖学术界的参与(Savage&Burrows，2007)。故而，社会学的危机表现在这门学科对“社会性”的理解和阐释已经失去了过去的 “优势”，亟需更新和升级自己的研究方法，避免陷入新的学科危机。

米尔斯的遗产显然不会缺席这场讨论，麦克·甘恩(Mike Gane)将危机划分为想象力的危机与测量的危机两个维度(Gane，2012)。首先，主流的社会学研究预先承认了标准化流程的量化或者质性研究方法的价值，这种先入为主的预设甚至决定了经验的研究问题，本末倒置地根据方法来生产经验世界的知识，社会学的危机也表现为对经验世界想象力的匮乏。其次，在大数据分析面前，过去因为测量能力受到重视的量化研究方法逐渐失去了它的重要地位。对测量危机的聚焦固然可以将提升社会学处理分析大规模数据的能力当作目标，但是仅凭新的数据分析工具，我们仍难以把握复杂多变的信息社会与数字生活。

二、技术无意识与时空的数据：

新社会性与数字麻烦

网络和数字技术嵌入的生活形成了新的“社会性”，不仅塑造和拓展了一种全新的社会空间，主体的存在与实践方式亦发生了很大的变化。这些新情境同样对社会学理论研究提出了迫切要求，仅仅局限于对方法的工具主义理解，实际上会限制我们对大数据时代“社会性”的认识。换言之，研究方法的更新升级并不能完全解决萨维奇等人提出的问题。社会学理论实际上也被认为走到了关键的十字路口(Beer，2016)，亟需在认识论和本体论意义上重新思考大数据时代的社会性。

“新社会性”：技术嵌入的数字生活

在万物皆可数据的社会，海量数据形成的洪流只是“社会性”的表征，日常生活中个体行动的展开乃至“个人麻烦”的形成，越来越与数据的生产和实践相关联。并且，数据的生产、收集、分析、处理、输出和流通形成了一个相对复杂的生态系统，在这个网络化的系统中，不仅存在生产和反馈的信息回路，过程中更涉及了不同行动者的参与。其中既有程序员和分析师这样的技术专家，也有软件应用、手机终端和无线网络这样的非人行动者。多元且异质行动者的存在，要求社会学拓宽自己的研究范围和对象，单纯依靠发展强大的数据分析工具对末端的作为生活实践结果的数据进行处理和分析，并不能把握当代数字生活与社会运行的全貌。显然，在方法的创新与分析技术的精进之外，大数据的发展还对这种“新社会性”的理论解读、阐释与批判提出了要求。

在大数据实践中，人们在物质世界的各种行动之所以可以转化为数据，在服务器的硬盘中写入和读取，并成为网络世界中流动的数据，不同功用的软件与硬件，它们作为具有能动性的非人行动者发挥了至关重要的作用。并且，相比于手机或者电脑这类通信终端的有形属性，在很大程度上，软件以一种隐身的方式介入我们的日常生活。从行为到数据，从数据到对人的分类、定位和排序，包含特定算法的软件是隐身的中介。

因为信息技术的广泛使用及其在日常生活中的深度嵌入，我们实际上生活在一个机器可读取(machine readable)与代码化的世界(coded world)之中。数据信息被软件自动且常规性地收集和处理，并不需要人工的干预。代码化的对象、软件的基础架构、分析处理过程和软件的集合一起，媒介化、补充、放大、监视、规制、促进并最终生产了我们在当代的集体生活(Kitchin&Dodge，2009:109)。在当代的数字生活中，软件的本体论意义在于，它是一种系统思维的显现，意味着世界如何被表现、处理和模型化地计算，并伴随着在世界中的运行而产生后果。甚至，编程在本质上意味着对世界知识的获取和展开(Kitchin&Dodge，2009:26)。用马修·福勒(Matthew Fuller)的话来说，需要将软件理解为一种“数字主体性”的表现形式，它建构了我们观察、了解这个世界以及展开行动的感觉中枢(Fuller，2003:19)。

在本体论意义上，软件和信息技术嵌入的社会生活，塑造和拓展了我们的社会空间(Clough，2000;Lash，2002;Thrift，2005)。帕特西亚·提西内托·克劳夫(Patricia Ticineto Clough)认为远程信息技术(teletechnology)对社会空间的重构，加速了边界化、去边界化和再边界化的过程，同时这种变化也释放了主体的能动性。尽管技术与日常生活的交织带来了一种全新的本体论体验，但是在重构的社会空间中，我们实际上对底层技术缺少清晰的认识，甚至存在一种无意识的状态。克劳夫使用“技术无意识”来概括这种我们在日常生活中无法进入，却又发挥了实际效用的技术活动与实践。为了破解这种无意识，我们亟需新的本体论视角来思考传统的诸如自然与技术、身体与机器、虚拟与真实这样的二元概念，尤其需要一种“差异关系”(differential relationships)的视角来取代过去我们惯于使用的二元对立或者辩证关系的阐释(Clough，2000:30)。

奈吉尔·斯瑞福特指出，软件的运行和使用会产生特定的效应，通过代码的形式和机械的书写，它生产了一种即时的社会空间(Thrift，2005:153)。但是，即便它在我们的社会和生活中地位如此重要，软件的社会性依然受到一定程度的忽视。斯瑞福特用“不在场的存在”(absent presence)来概括软件的隐身状态。在我们的日常生活中，软件或者信息总是以一种隐身的方式运作。对大多数人而言，他们可以很熟练地使用互联网以及各种各样的数字设备和软件应用，但是对背后的数据生产和会对他们的社会生活带来实际影响的权力机制缺少清晰的认识。基于这样的日常生活体验，许多理论家认为信息技术构成了我们的生活，而不是将它简单地理解为一种媒介。这种信息与生活相互结合与交织的形态，在斯科特·拉什看来，固有对信息的认识论和本体论理解在当代的新媒体形态下已经崩塌(Lash，2006)。本体论变得越来越具有认识论的特征，认识论意义上的认知方式也越来越成为一种存在方式。

显然，“大数据”虽然成为普遍接受的时代前缀，但是仅仅通过数据的话，仍难以把握当前时代的全部特征。技术嵌入生活所生产的新社会性，在数据背后仍有许多容易受到忽视，甚至是隐身的行动者和对象，亟待社会学想象力的理解与阐释。

“数字麻烦”：透明的个体与时空的数据

数字技术在塑造和拓展社会空间的同时，赋予主体更多的选择和更大的延展性。但是，在享受数字便利的同时，“我们”的信息和数据无时无刻不被生产、收集、处理、分析和流通。在诸多便利背后，我们越来越容易遇到各种各样的“数字麻烦”，诸如隐私安全、数据滥用、数据歧视、大数据杀熟和个人偏好带来的“信息茧房”(information cocoons)问题。甚至因为沉迷于收集信息和数据，盲目迷信算法输出的结果，任由算法来“管理”我们，而成为“数据专制”(dictatorship of data)的受害者(Mayer-Schounberger&Cukier，2013: 166)。更为严重的是，个体在大数据的实践中变得越来越透明，而与之形成映射的数据却在一个隐秘的空间中被分析处理，并影响我们的现实生活，“黑箱社会”成为当下数据时代的隐喻。

这些现象和问题改写了我们对网络与信息的认知。早期对信息社会的批判中，拉什概括了信息社会中人们生活形式的技术化特征，认为我们通过由控制论模型主导的技术系统来认识世界，技术文化在本质上属于一种远程文化(culture at a distance)，我们的生活亦是一种远程的生活。这种生活具有扁平化、非线性以及无固定位置的特征。其中，非线性又包括了生活中信息的压缩、时间的加速和网络的延伸(Lash，2002:15-22)。在拉什成书的时代，数据概念还不像今天这样流行，在一定程度上还限制在实证主义的工具性理解中。拉什强调，对信息和信息社会的阐释需要新的解释，以区别于过去丹尼·贝尔(Daniel Bell)、阿兰·图海纳(Alain Touraine)和曼纽尔·卡斯特(Manuel Castells)等人的理论。传统的社会学分类将信息视为叙事、话语或者制度，但是在拉什这里，信息更具有社会本体论层面的意味，信息是数据流，意味着脱嵌、时空压缩和即时关系，并且对信息社会的理解，更应该关注它的非理性后果——我们面对的是一个比特信息或多或少有些失控的社会(Lash，2002:2)。

拉什的论点表现出一定程度的先见之明，在大数据时代的当下，数据日益成为学者关注的对象，以比特为单位的数据洪流构成了基本的社会情境，软件和硬件的发展提升了数据收集和分析处理的能力，在带来工作效率和生活便利的同时亦暗含了更大的不确定性和失控的风险。尽管日常生活和事务性的数据被大量生产、收集和分析，并被应用到商业或者治理领域的实践中去，但这种数据实践的过程并不为作为数据来源的普通民众所了解，很多时候数据的获得甚至来自对不知情网络用户的监控，这种数据实践具有极大的不透明性和潜在的风险。弗兰克·帕斯奎尔(Frank Pasquale)用“黑箱”的隐喻来描述这种状况:一方面，它如同飞机或者机车上负责数据监控的黑匣子，是记录安全的重要设备;另一方面，黑箱又意味着一个在暗中神秘运作的系统。我们无法确切地知道自己的信息被转移到何处、如何被使用以及它可能带来的后果(Pasquale，2015:3)。

并且，数据像矿产一样经过提炼之后可以产生价值，许多互联网公司都有自己的“暗箱技术”(opaque technologies)，在暗处针对用户使用秘密的算法和数据分析。这里固然有商业方面的原因，但是这种不透明会消极地影响我们对当前世界的认识(Pasquale，2015:163)。在黑箱社会中，我们面对的是一个数据失控的社会，存在透明的市民与不透明的治理和商业机制之间的矛盾。帕斯奎尔认为黑箱状态下，对数据的收集、流通和分析相对而言处于失控的状态。在美国的社会情境中，现行的隐私保护法并不能有效地解决失控数据带来的危险。

用户的信息总是在某处或者某个服务器的节点被秘密地分类、排序和评分，甚至在不知情的情况下被数据掮客们(data brokers)重组和出售以获取利益。这种数据实践对用户来说并不公平，甚至存在较大的风险。因为不同公司、组织和机构数据流通链的存在，失控的数据往往会带来“串联的不利条”(cascading disadvantages)(Pasquale，2015:32)。个体所遭遇的困境在于，在某一个节点被收集的用户信息，可能在另一个节点被分析处理，并在现实生活中对个体产生实际影响。

在数据失控的黑箱社会中，作为数据生产者的个人和作为数据收集与分析者的组织机构之间存在极为不对称甚至是不平等的关系。菲恩·布兰顿(Finn Brunton)和海伦·尼森鲍姆(Helen Nissenbaum)认为，这种信息不对称塑造了我们日常生活中的隐私与主体性实践。虽然我们对算法、技术和数据库将如何处理与分析我们的数据一无所知，我们面对的却是一个从无意义到有意义不断转化的过程，微小的事物在我们的数据生活中很可能会带来意想不到的后果，影响我们的税率、保险费率、资本的获取，甚至是流动的自由(Brunton&Nissenbaum，2015:50)。在帕斯奎尔这里，软件根据特定的算法，对用户进行秘密裁决(Pasquale，2015:8)。在决策过程中，“自动”的机器取代了作为主体的个人。

技术无意识和黑箱社会在本体论层面揭示了当代社会的数字生活，对社会学而言，仅仅着眼于数据分析的工具潜能并不能解决萨维奇等人发出的学科危机预警。并且，与克劳夫成书的2000年相比，信息技术在20余年里取得了突飞猛进的发展。从有线网络到无线网络，从3G到5G技术，在今天的互联网或者信息社会中，各种各样的应用、数据和算法无处不在，它们已经彻底渗透了我们的生活，但是作为一种底层的社会架构，其设计和工作的过程依然不为大众所知悉。这也意味着，对当代社会中“数字麻烦”的社会学理解和阐释，其背后的社会结构和制度因素需要结合新的社会情境，尤其是信息技术高度嵌入社会生活的基本形态来加以翻译和转化。

三、数字化分身、算法权力与反思：

解锁大数据时代的个人困扰

关于如何实践社会学的想象力，米尔斯在著作最后的附录中强调，学者应发展自己的“智识技艺”，他提醒我们密切注意个体的多样性和纪元性社会变迁的模式，以不断修正我们对历史、个人经历和社会结构问题的看法，并运用我们的所看和所想，作为研究人类多样性的线索(Mills，2000:225)。在这里，智识技艺并不是固定套用的理论或者方法，它需要我们在研究中保持开放的眼光和心态。

在21世纪的想象力升级方案中，不同于史蒂夫·福勒和奥萨瓦德等人提出的“新想象力”，奥利·皮廷恩(Olli Pyyhtinen)从认识论出发，强调想象力和它的当代拓展依然是以社会实体论(substantialist)为中心，它假设社会世界由个体、团体、制度和系统这样的实体所构成，对个体行动的理解亦需要在社会结构中展开。皮廷恩提出了发展一种“超越人类中心的社会学想象力”(more-than-human sociological imagination)的方案，以关系属性来解放实体论，并将非人行动者纳入研究对象(Pyyhtinen，2016)。

皮恩廷的方案不乏启发意义，但是“新想象力”并不意味着我们要放弃人和社会结构这样的分析对象，在虚拟与现实相互交织的大数据时代，二者已经超越了实体论的存在方式。数字技术不仅塑造了全新的社会空间，还极大地拓展了主体存在、表现与实践的方式。我们在变得越来越透明的同时，不仅成为数据主体，还在网络中获得了算法身份。欧盟2016年发布的《通用数据保护条例》将数据主体定义为可通过个人数据直接或者间接识别的自然人(EU，2016:33)。而信息技术根据特定的算法对我们行为所衍生数据的分析，会推论出算法身份(Cheney-Lippold，2011)。

通过数据识别的主体，以及根据算法推论的身份，基于数据质量、分类标准和分析目的的因素，存在与现实不一致甚至冲突的可能。并且，数据主体与算法身份并不是自成一体的存在，它更像是与现实存在对应的分身。本文以“数字化分身”来描述数据主体与算法身份背后暗含的紧张关系。在物理时空的身体之外，在不同节点的网络空间中存在与之形成映射的数字化分身，两个身体和身份之间有着密切的关联却又非完全对应，它们之间的张力亦会造成新的个人麻烦和社会问题。同时，服务器中软件对数据的处理，特定算法生产的“事实”建构了一种新的社会结构，引起了人们对算法权力和技术伦理的追问。

“解锁”有打开和揭示的意思，在软件和数字设备中，解锁意味着打开被屏蔽和隐藏的内容或者功能。“解锁”大数据时代的个人困扰，建立个人与社会结构的联结，不仅需要解构数字化分身，揭示生产它们的社会结构，亦需要关注数据实践中人们表现出来的能动性。

数字化分身：数据主体与算法身份

随着越来越多的感应装置与智能手机整合，以及其他记录身体信息的可穿戴和可移动数字设备的普及，它们几乎成为现代人身体的数字“器官”。在这里，与互联网的接入并不简单地意味着浏览网页这样的信息获取行为。感应设备对类似个体空间位置的移动、心率等生物信息的收集和分析，可以在用户不知情的情况下发生。个体和与之互动的社会结构被嵌入了大量的数据、信息和技术要素。在社会运转的过程中，越来越多的非人行动者以不可见的状态发挥着至关重要的作用。

个体作为“个人麻烦”的承载者，其在大数据时代的存在与实践方式发生了巨大的变化。行动者与社会结构这样的社会学经典命题，在时空压缩的数字时代面临改写的必要。在信息技术打造的社会时空中，甚至个体也在网络连接和数据流中成为不同服务器中的“数据主体”。不同于物理空间中的身体，数据主体或者算法身份并不是与现实中的个体完全对应的数字化分身，而是被分解为碎片化的信息与数据。在物理空间的肉身之外，这些信息断片在不同的网络节点中被不断重组和阐释，并根据特定的算法进行分析和归类，进而形成一种全新的数据主体或者算法身份。

更重要的是，在不同的服务器节点中，个体相关的数据会在分类和排序的过程中生成一种与现实生活不一致的算法身份。例如，服务器根据收集到的用户信息，可以按照算法“自动”地将用户归类为男性或者女性、中等收入群体或者高收入群体，在治理层面亦可以根据算法“区分”用户的政治认同或者价值取向，甚至将其识别为潜在的风险对象进行干预。这种自动化的处理过程存在错位的可能，并且这种错位会因为数据流通链的存在而引致帕斯奎尔所谓的“串联的不利条件”。数字化分身在底层的技术维度是一行行的二进制代码，但是在数据和信息的流通链中却会在日常生活中带来物质性的后果，甚至影响我们的资源分配和生活机会。

即便存在如此重要的功能和后果，用户和他们的数据之间却往往存在不对称的关系。我们的生活和行动生产了数据，但是它们却隐匿在不知何处的服务器中，并在私有或者公共部门的分析软件中被分配新的身份。作为消极后果，约翰·切尼-利波尔德(John Cheney-Lippold)认为这种新的算法身份的出现，意味着我们在网络中已经失去了对定义自我身份的控制，同时也失去了构成我们身份的分类的所有权(ownership)(Cheney-Lippold，2011)。算法对主体身份的分类更加灵活，分析工具可以根据实时的数据进行处理。算法身份的产生，更大的可能是根据市场的需要来定义性别分类。性别不仅变成了数字，对它的规制亦完全嵌入了消费的逻辑。

在当代公共部门或者行政机构的常规数据收集和分析中，算法身份的形成亦意味着一个可监控和可治理对象的诞生。同样地，这种对象并不是与现实中主体完整对应的数字化分身。数字环境下的监控和治理对象，并不是物理时空中存在固定边界的实体，身体的数字或者数据化使之被打碎，从而转变成为一系列离散的信息和数据流。这种去物形化的身体在不同网络和机构的节点中不断发生重组，按照特定的标准和算法，分析处理并划分为被干预、治理、惩罚和规训的对象。数据流的存在和形式极大地提高了社会干预和治理的灵活性与时效性，同时这种纯数据或者信息化的个体存在，使得今天的我们更多地表现为赛博肉身与技术的混合物(cyborg flesh/technology amalgamation)(Haggerty&Ericson，2000)。

技术要素嵌入的数字化生活和社会实践以及身体与数据的混合拓展了主体存在和展开社会行动的方式，亦加大了我们遭遇个人困扰的可能。一方面，主体成为碎片化的数据流，与之关联的分身可以在不同时间和空间节点的服务器中被分析处理。这些数据流并不完整，对它们的分析和输出存在偏差的风险，却往往会在我们不知情的情况下带来现实性的后果。另一方面，网络节点中数字化分身的存在，尤其是不一致算法身份的产生，不仅会在现实生活中带来困扰，亦极大地挑战了我们的主体能动性，影响我们对自身主体身份的定义，甚至使我们被动地被赋予一些身份。

算法权力：信息技术与社会结构

对数据主体存在形式以及数字化社会情境的讨论并不意味着社会结构是一个过时的概念需要被摒弃。一种新的具有数字化特征的社会结构正在形成并在社会生活的各个方面发挥作用。在拉什描述的后现代社会中，权力在技术资本主义中通过排斥而不是通过生产过程中的剥削来运作。按照这种逻辑，社会不平等的产生更多地取决于个体在空间中的位置，而不是生产中的位置。社会阶层问题也不再是生产资料的问题，而在于是否能够进入技术中介的平台(Lash，2002:24-28)。针对这种信息社会的结构特征，拉什使用“活区”(live zone)和“死区”(dead zone)来对应经济空间，并用“顺区”(tame zone)和“野区”(wild zone)来描述身份空间，四种区域的组合分别对应了不同的社会阶层。拉什为后现代时期的社会阶层提供了一种新的类型学阐释，他用社会学的传统概念表达了全球信息社会的分层后果。

在计算机语言中，算法表示通过一套规则过程来解决具体的问题。作为一种社会权力，算法有能力塑造我们的社会和文化形态，直接影响个体的生活(Beer，2009)。算法无处不在，它会在日常生活中引起广泛的社会后果 (Willson，2017)，甚至对生活世界进行殖民(Gilbert，2018)。在大数据实践对社会结构的建构中，特殊形式的算法发挥了越来越重要的作用，它们不仅生产了我们的数字化分身，亦决定了信息社会中稀缺资源的分配与流动。在一定程度上，信息或者数据背后潜藏的价值，使之成为大数据时代的新经济资产，亦使得对算法的治理成为社会治理在新时代与新技术情境下的迫切需求(Just&Latzer，2017)。结合前面的论述，数据已然成为一种可供转化的资本，算法则代表了数据背后运转的转化机制。换言之，正是数据和算法决定了社会成员在拉什所划分的空间组合中的位置。

由此引发的问题，是对发挥“自动化”或者发挥“裁决”作用的算法，对其价值、权力和政治的反思与批判。算法权力通过生产“事实”来运作，它不仅是系统输出的结果，也是特定价值规范、理性方法或者模式的话语性强化(discursive reinforcement)(Beer，2017)。信息技术自动化与实时的处理能力，易于塑造大数据和算法科学与客观的形象。但是，自动并不意味着公平，算法并不是道德或者价值中立的技术。设计算法的目的包括生产价值和资本、推动行为、结构化偏好，以及对人的识别、分类和排序(Kitchin，2017)。并且，它无法对社会偏见免疫，当开发者和程序员在敲打代码的时候，潜在的价值被嵌入了软件产品中(Pasquale，2015:38)。

互联网公司在利益的驱动下，实践帕斯奎尔所谓的“暗箱技术”，其过程更具有隐蔽性，且后果也更难预料。例如，2018年年初，某互联网公司在其应用软件的年度账单中，以不起眼的方式将用户与其旗下另一产品的服务协议绑定，使之成为新平台的用户。这种操作显然是对用户知情权的极大漠视，给用户的信息隐私安全带来了不确定的隐患。对平台而言，作为一种商业利益驱动下的数据实践，透明的用户只是一个非人格化的ID，失去用户控制的数字化分身可以任意地在服务器中被处理、转移和操纵。

不对称的关系、代码化的技术特征，以及隐身的状态无疑加深了社会学介入算法权力研究的难度。但是在技术和数学的语言之外，同样可以对它进行社会、文化和政治的批判性阐释。一方面，针对算法权力带来的现实性和物质性后果，可以将其中的个人困扰和麻烦转化为公共议题的讨论，将捍卫公共价值当作社会学的目标。另一方面，算法的设计和实践具有关系性和情境性的属性，它不是一个单纯的技术化实现过程，而是涵盖从理念到产品、从开发者到程序员、从应用到用户、从数据到算法输出的事实，这也为对过程中不同行动者的经验研究提供了可能。

反思数据实践：隐私策略与数据素养

虽然大数据实践挑战了我们的主体能动性，它所带来的个人困扰亦构成了大数据时代的不安与焦虑，但是，数据或者算法权力对个体而言并不完全意味着宰制，在研究中需要关注个体的能动性与反思性实践(Nick&Alison, 2014; Helen et al., 2015)，通过发展“隐私策略”(Brunton&Nissenbaum, 2015)和“数据素养”(data literacies)来应对数字困扰(Pangrazio&Selwyn，2019)。

针对大数据实践并不透明的现实，布兰顿和尼森鲍姆用“模糊化”(obfuscation)的隐私保护实践来作为应对信息不对称的策略，将其形象地比喻为在运转的齿轮中掺杂沙子，它通过在信息和数据中有意地加入模糊甚至是误导的信息来应对数据收集与监控。当然，在数字化或者万物皆可数据的时代，布兰顿等人强调模糊化只是对固有隐私工具的补充，而不是简单地取代后者。并且，隐私策略并不意味着要去阻断数据的流动，而恰恰需要智慧和公正地来引导数据的流动，以实现社会的目的和价值，尤其是照顾弱势主体的利益(Brunton&Nissenbaum，2015:98)。类似地，帕斯奎尔提出了模糊化的隐私保护策略，并以“公平的数据实践”来应对数据失控的现象。因为数字时代的隐私保护具有一定的技术要求，不同代际群体因为媒介素养的差异可能会存在较大的区别，帕斯奎尔特别强调全社会的共识与责任才是解决数字歧视的方法(Pasquale，2015:21)。甚至需要一个新的“算法师”(algorithmists)群体，其角色如同金融会计师一样，在公司和组织的内部与外部发挥专业作用，监督数据与算法的实践以实现可靠性与公正性(Mayer-Schounberger&Cukier，2013:179)。可以预见的是，算法师不仅需要具备数据和计算科学的技能，同时还要具备社会科学知识素养。

在今天的日常生活和工作中，个体难以完全摆脱信息和网络的影响，通过断开连接将自己封闭在网络世界之外。但是，在隐私保护的过程中，对个人数据的管理需要一定的技术能力以及持续的日常维护，这也引发了对数据隐私责任归属问题的讨论。如果我们在隐私保护的问题上只是单纯地强调个体的责任，这种自我责任化(self-responsibilization)的做法很可能超出了个人所掌握的信息能力或者数字素养，或许更现实的解决之道在于采取自上而下的办法保护数据安全(Pangrazio&Selwyn，2018)。

面对自己的数字化分身，个体的隐私策略可能存在悖论。对隐私的重视和信息安全的担忧是大部分民众的想法，但是在日常生活实践中却极有可能无法接触到自己的数据，更难言据此进行安全上的选择。这不仅是信息能力的问题，亦涉及不同组织机构对数据的储存、持有和垄断。

针对个体对涉及自身相关数据的不可把控，数据生产者和数据相关利益获取者之间扩大的失衡，以及数据本身蕴含的权力关系和新社会性等问题的出现，一些学者提出需要在这种被数据包围的新社会情境中培育个体新的数字素养。一般而言，这种新形式的数字素养纳入了数据与安全的考量，包括诸如隐私素养、信息素养、代码素养和算法素养等内容(Pybus et al.，2015)。乃至在今天，数据素养需要取代传统意义上以掌握信息技能为代表的数字素养(digital literacies)，前者已经成为个体在当代社会生活中的一种重要能力(Pangrazio&Selwyn，2018)。

米尔斯时代的想象力需要“解锁”宏观的社会结构、制度与日常生活中个体之间相互联结的链条，使个体能够站在社会和历史的高度理解自身的处境与时代。今天我们面对的是一条隐形的数字锁链，运用新的想象力“解锁”大数据时代的个人困扰，关注数据实践中数据主体与算法身份的生产和建构，不仅需要追问算法事实背后的价值、权力和政治，还需要通过适当的隐私策略和数据素养来避免个体在数字时代迷航。对社会学而言，就是要通过对公共议题的讨论来实践新想象力，凝聚社会组织、政府部门和商业机构的共识，进而推动大数据和算法的治理，以在组织与制度上形成更为积极透明和有效的规制。

四、结语

在中国情境下，学者们围绕大数据带来的机遇与挑战(张文宏，2018)、方法的创新与宏观量化研究的重启(陈云松等，2016)、计算社会科学中理论与方法的对话(罗家德等，2018)、学科的重构与跨学科的合作等议题进行了诸多有益的探讨(罗玮、罗教讲，2015)，相关研究多集中在方法论和量化研究领域。值得注意的是，技术嵌入生活所塑造的新社会性，以及由此产生的“数字麻烦”同样对社会学的理论研究提出了迫切要求。

在数据洪流中，数据和数据分析的存在可以实现积极的赋能。对研究者而言，高质量的海量数据可以支撑更为复杂的研究，可靠的研究成果可以在政策与应用层面带来积极的结果。对普通个体而言，数据亦成为一种赋能工具，是个体在日常生活的行动实践中了解自己、社会乃至世界的重要资源。

另一方面，在大数据的回路链条和生态体系中，黑箱社会的隐喻意味着数据或者科技赋能背后存在的不确定性和风险。更为重要的是，在我们便捷的数字生活背后，技术维度的代码和算法并不是自然且中立的事物，它们在生产过程中被人为地写入了特定的内容，以表达特定的价值和规范。在“代码即法律”的互联网时代，我们能用代码来捍卫某种价值，也能让某种价值消失(Lessig，2006:5)。大数据分析既可以是理性决策的工具，也可以是强大的权力工具，在实践过程中生产和制造新的不平等。

从研究对象上说，大数据的社会学研究不能局限在末端的数据，数据的生产和实践存在多元行动者的参与，软件、代码、算法和数字设备这样的非人行动者也应该受到重视，成为实践想象力的新对象。在数字化分身和社会空间的生产过程中，它们以隐蔽的方式发挥了不可或缺的作用，并因其技术化特征而易于受到忽视，甚至被默认为理性和中立的技术应用。

在升级版的社会学想象力中，当代社会学固然要积极地介入大数据研究，在方法工具的层面学习和掌握新的分析技术与处理海量数据的能力，亦要在理论层面批判性地理解和阐释这种数字生活所形成的新“社会性”，将普通人会遇到却又无力解读的“数字麻烦”翻译和转化为公共议题。尤其是在经济或者利益驱动的大数据分析之外，以这种升级版的想象力来捍卫大数据时代基本的公共价值，用社会学的微光点亮大数据的黑箱社会，致力于将当代数字生活中不可见的部分变得可见，将不透明的过程变得透明，缩小不对称关系的鸿沟，实现对平等关系的追求。