分享

如何理解数据化的世界?一种方法论指南 | 社论前沿

 细雨青衫 2023-03-08 发布于重庆

摘要《让数据化的世界有意义:方法论指南》一书于2020年出版,该书探讨了数据化是近年来最相关但最有争议的现象之一。作者选择翻译该书导论部分,以便与读者分享探索和理解数据世界的原创方法论,以及相关建议。

这是社论前沿第S3036次推送

微信号:shelunqianyan

简  介   

简单地说,数据化涉及到一些过程和实践,通过这些过程和实践,普通的、短暂的、基本“看不见”的行动被转化为主要是数字的、至少是一种系统化的、定量的和可分析的数据,这些数据为社会上所有重要的决策提供信息。

数据化几乎在生活的所有领域都可以看到。给家人打电话、使用计步器、在社交媒体上互动、通过银行转账或信用卡购买物品或服务,这些只是留下数据痕迹的几个例子。虽然这些数据使我们能够理解社会进程,但数据饱和的日常生活已经成为一种需要研究和解释的现象。

如何理解数据化世界  

社会科学领域第一次对数据革命的讨论就对现有社会科学原则在新的大数据背景下的调整持相当怀疑的态度。一方面,人们预测了认识论和范式的巨大转变;另一方面,人们在传统统计学和新型计算模型之间寻求第三条道路。同时,数据研究的出现引发了人们对数据的社会和文化后果以及由于创造、收集和使用这些数据而产生的现实进行了批判。长期以来的争议为如何研究数据化世界的讨论提供了经验。以下10点方法可以用以解释和理解数据化世界。这10点看法来自于国际学术辩论、本书各章节以及一些实证研究经验。

1. 数据关系是分层次的。数据的创造、收集和使用是一个相互依赖、复杂和交织的社会过程。在数据工作方面,重要的是要理解交织在数据生命周期中的相互矛盾的和层次分明的关系。

2. 数据化的世界是由网络化的链接所支配的。传统的、线性的和因果的解释对于理解数据化世界是不够的。相反,我们需要关注网络化的连接来理解它。

3. 数据基础设施是一种公共产品。数据的多样性和平等的数据访问权限是最重要的,也是一项社会权利,数据主体、数据公民、数据活动家、数据工作者以及数据化世界的研究人员应该为此而奋斗。

4. 伦理和数据正义应该是数据化世界的支柱。收集、分析和解释数据,以及决定不这样做,从数据主体和社会的角度来看,必须是道德的、公平的和合理的。

5.语境为王。数据总是需要解释的。解释必须源于社会文化背景。

6. 数据不是自发产生的。数据工作者和研究人员在计划和制定数据创建/收集方面有积极作用。数据的创建和解释应该根据实际需要,并遵守数据公正和道德的原则。

7. 理论不是“死”的。对数据化世界的研究始于相关的、有充分信息的问题。对数据的解释必须与有关特定现象的现有知识进行对话。

8. 欢迎来到方法论多元化的时代。应把各种方法结合起来,找到回答研究问题的最佳和最灵活的方法。

9. 让范式之争成为过去。对数据化世界的理解应该以实用主义原则为指导;任何学科都不能垄断数据化过程和概念化结果。

10. 数据工作者是最主要的认识论工具。数据工作者应该对自己的选择有批判性的自我意识和认知。

数据化与数据转向   

作者将数据和数据化称为本体论(数据作为一种创造的现实或构建现实的手段)、认识论(数据作为一种知识形式),并经常作为一种意识形态的过程。学者们将数据化定义为转变为结构化的数据格式,进而促进和鼓励量化。人们经常声称,数据化是世界上发生的其他变化(如数字化)的一个不可避免的副产品。

通过信息技术进行的活动会留下 '数据碎屑的痕迹'。尽管在许多流行的和专业的讨论中,它们的出现被认为是不可避免的,但任何数据代理人(数据创造者、使用者、工作者或研究者)都应该问自己,收集、归档、汇总和为特定目的使用数据碎屑是否必要。仅仅因为某些东西可以变成数据,并不意味着它是一个好主意。有鉴于此,关于理解数据化世界的第一个建议可以被扩展和阐明:数据的创造、收集和使用是一个复杂的社会过程,在这个过程中,数据分析者(在数据的基础上做出决策)必须考虑数据所创造的社会现实,包括通常矛盾的和等级化的数据关系。

数据和社会之间的联系是复杂的。一方面,数据的产生是由于人类生活和社会中发生的过程;数据被用来分析和概念化这些相同的过程--从这个角度可以说,数据是社会的一部分。另一方面,数据导致了全新的社会现象的出现。因此,必须明确用于解释数据和社会之间关系的视角,并询问我们是对数据驱动的、基于数据的还是基于数据的社会进程感兴趣。这种情况下,关于理解数据化世界的第二个建议可以表述为:线性解释和方法可能无法完全解释网络化和紧密联系的过程。应该更多地关注行动者的网络,这将使我们能够通过多层交织的联系来理解复杂的数据化相关现象和可能性。

对重要的社会活动进行量化并不是什么新鲜事,这些对数据主体信息的强烈关注确实导致了权力集中到拥有数据的人手中。因此,数据使用的原则,比如法律保护和数据在法律领域的使用,与数据使用相关的伦理原则和数据公正相关的问题,这将引向关于理解数据化世界的第三点建议:在数据化的世界里,数据基础设施不是机构拥有的,而是应该被视为创造公益的机会,以便将数据的多样性引导到社会的多样性,并促进基于数据变化的战略管理。

数据并不代表它所关注的个人的数字复制。相反,数据集反映了对其他数据工作者价值观的研究,包括他们对经典社会人口统计学(性别、种族、收入、年龄组、教育水平)的解释力。数据化社会中的知识生成假定将数据视为认识论和本体论,同时也提出了许多与数据正义相关的问题。其目的是确保数据能够确保更大而不是更小的社会正义。这些讨论为理解数据化世界的第四个建议提供了依据。除了当代研究伦理的要求(避免对研究参与者的伤害),从数据主体和社会的角度来看,数据的收集、分析和解释必须是合理和公正的。在解释数据化的世界时应该考虑到相同的背景,这个前提启发了第五个建议:为了理解数据化的世界,因此,在计划研究和收集、分析和解释数据时,研究者必须考虑所研究的现象和数据的社会文化背景。

数据先于事实,是我们知识的基础,是客观、明显和透明的东西,只需要仔细收集和测量。自发的数据在研究和日常生活中经常被提及,但根据批评者的说法,它实际上并不存在。基于这些讨论,提出了理解数据化世界的第六个建议:数据不是自发出现的,它是研究者选择的结果,也就是说,研究设计塑造了可能的解释和概括。

方法多元化和方法论转向   

在数据化背景下的知识生产辩论中有两个核心问题:(1)测量技术,希望新的数据能够更客观地测量现实;(2)传统(如统计)与计算(如机器学习)方法。“理论的终结”和“描述性经验主义”也许是这方面比较知名的方法,它们声称假设和模型检验以及使用数据来确认理论模型的方法已经过时。相反,数据驱动的分析是基于相关的关系,但没有解释这些关系所基于的社会机制。根据安德森的方法,理论在研究中的作用将大大减少。然而,在理论终结假说的启发下,最近一项分析知识生成实践的实证研究并没有证实这些假设。

计算方法可以同时是演绎的和归纳的。由于某些能够解释特定现象发生原因的计算方法越来越受欢迎,社会科学中的归纳性转向也将随之而来。一种基于归纳逻辑的计算方法是基于机器学习的分析。机器学习被框定为解释复杂现象的完美解决方案,因为它不测试假设,而是从对先前经验的系统评估中产生问题。除了检测数据模式,机器学习方法的最新进展旨在解释数据中的因果关系。换句话说,与其回答“是什么”的问题,还不如回答“为什么”的问题。这些讨论和该领域的早期实证研究得出理解数据化世界的第七个建议:理论并没有死,也就是说,尽管有新的数据、分析技术、软件和方法,研究数据化的世界仍然要从提出问题开始。

总的来说,方法论的多元化在实证工作中仍然占主导地位——新兴的计算方法与经典的定性和定量方法同时被应用。这使得描述和预测因果关系成为可能,同时也使复杂的网络化现象的原因变得合理。所述的辩论建议在大数据和小数据的基础上增加丰富和厚实数据的类别。根据这一论点,可以提出了理解数据化世界的第八个建议:灵活使用混合方法,为数据化世界中发生的复杂现象提供一个整体的画面。

批判现实主义和实用主义被看作是一种方法,在范式辩论和方法多元化的背景下理解数据化世界而提出。批判现实主义产生于方法论的多元化,并关注人的能动性,而实用主义则建议不仅要抛弃定性与定量、数据驱动与解释的比较,还要抛弃对“终极真理”的寻求,并以“终极效用”的原则取代它们。这两种方法都建议通过使用混合方法解决(研究)问题,并从研究问题、问题或研究目标出发,而不是固定在具体的分析步骤上。根据这一建议,可以得出理解数据化世界的第九个建议:选择研究方法应基于实用性原则,而不是范式之争。

选择使数据化有意义的方法需要考虑数据主体和数据工作者的反思能力。批判现实主义的数据化方法强调了积极的数据公民的重要性,他们不仅有能力保护数据主体的利益,而且在开放数据的帮助下,也能为数据分析做出贡献。这些趋势已经通过数据活动主义和数据公民的新兴形式的概念进行了阐述,并允许更多的公民参与数据化进程。因此,对理解数据化世界的第十个建议是:研究者的反思性--研究者批判性地评估其行为后果的能力--在对数据、方法和解释方式的多样性做出选择时非常重要,并有助于确保社会利益和避免研究的任何可能损害。

为了研究数据化世界的多样性,研究者需要有一个开放的心态来结合和重新混合各种方法。根据研究目标,各种方法--数字的、虚拟的、计算的和/或解释的--可能被证明是有用的。然而,尽管有上述的转变,一个数据化的社会仍然是一个社会环境,个人仍然是人,任何人都可以成功地将这种复杂的系统概念化,唯一方法是结合适当的方法,并利用广泛的可用工具,理论也继续比以往更有用。

图片

文献来源:

Masso,  A., Tiidenberg, K., Siibak, A. (2020). Sisseuhatus [Introduction]. In  'Kuidas mõista andmestunud maailma? Metodoloogiline teejuht’ [How to  understand the datafied world? A methodological guide], Masso, A.,  Tiidenberg, K., Siibak, A. (eds), p 11-41, Tallinn: Tallinn University  Press.

文献整理|唐斌斌

美编|唐斌斌

责编|Hrui

图|网络

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多