学术思想是如何扩散的？| American Sociological Review

投沙斋 2023-05-22 发布于北京

展开全文

摘要：

什么情况下新的知识贡献（intellectual contributions）能够扩散并融入后来的科学工作中？过往的研究倾向于关注整体的文化产品，例如专利和文章，并强调外部社会因素的重要性。本文关注的则是反映学术思想（ideas）的概念本身；同时，作者分析了社会因素和内部知识结构对思想扩散的影响。为了验证这一观点，作者使用计算技术（computational techniques）来识别二十年来（1993年-2016年）在Web of Science中引入的近6万个新思想，并跟踪它们在后来发表的3800万份论文中的扩散情况。作者发现，当新思想产生社会或学术的共鸣时，它们会更广泛地扩散：当新思想涉及到由不相关联的作者组成的广泛网络（reach expansive networks of unrelated authors）、在学术使用中达成了一致（achieve consistent intellectual usage）、与其他重要的思想相关联（are associated with other prominent ideas）、并与现存的研究传统相契合（fit with extant research traditions）时，它们就会成为学科的核心概念。在一个思想发展的后期，尤其是当它们与学术环境的关系建立起来之后，这些生态条件发挥着越来越大的决定性作用。本文推动了对科学思想的系统研究，它超越了产品而关注思想本身，并应用了一种关系性的视角（relational perspective）。

作者简介：

Mengjie Cheng，哈佛商学院

Daniel Scott Smith，斯坦福大学知识创新实验室

Xiang Ren，南加州大学计算机系

Hancheng Cao，斯坦福大学计算机系

Sanne Smith，斯坦福大学教育学院

Daniel A. McFarland，斯坦福大学教育学院

文献来源：

American Sociological Review. Online First

本文第一作者：Mengjie Cheng

为什么有些新思想会有较为长远且多元的发展，在不同的社会行动者和不同的文化背景中广泛传播、一路蜕变，而另一些则昙花一现、用途有限，且很快就被大众遗忘？这个问题是对于知识的特性、结构和发展等方面研究的基础（underpins）。在这个以知识为基础（Powell and Snellman 2004）、由互联网驱动的社会中（Castells 1998），所有人都被不断扩展的新思想所淹没，无论是在网络中（Bail, Brown, and Wimmer 2019; Shifman 2013）、在商业中（Beath et al. 2012; Fuller 2010）、还是在科学研究中（Adair and Vohra 2003; Huth 1989; Prasad et al. 2010）。的确，新思想和新知识是科学和技术持续进步的基础，也是有效决策、组织变革和经济进步的基础。然而，尽管许多新的发表论文、发明以及产品提供了新的知识贡献，但只有一些在坚持，在传播，并被有意义地纳入集体理解和知识基础（collective understanding and knowledge base）（Heath and Heath 2007）。了解这种情况的发生方式和原因是本文想要关注的重点。

什么是新思想？

各种不同领域的研究文献都关注到了新思想的扩散，但它们在对新思想的描述和采纳机制上有所不同。例如，关于创新扩散的研究将新产品作为新思想的反映。从这个角度来看，产品是文化的完全形态（gestaults）或人工制品，就像新书（Dodson and Muller 1978）和发表的论文（Crane 1972）、歌曲（Salganik, Dodds, and Watts 2006）、药物（Coleman, Katz, and Menzel 1957）和发明（Rogers 1976）。在某些学科中，用新产品来指代一个新思想也是有直观意义的（Merton 1968；Small 1978），比如Keuchenius、Törnberg和Uitermark（2021）将格兰诺维特（Granovetter）的文章“弱关系的强度（The Strength of Weak Ties）”等同于“弱关系”的想法。在这些情况下，作为产品的文章被渲染成高度便携的概念象征物，得到了自由且广泛的传递。

然而，大多数科学论文都涉及各种新的和旧的想法，进而把文章作为一个整体产品来关注，会导致对“新想法”的表述更为通用且粗糙（Foster, Rzhetsky, and Evans 2015；Uzzi et al. 2013）。这阻碍了学者去精确定位和追踪新思想扩散过程。例如，之前的研究发现，引用某一参考文献的原因多种多样，其中只有一些是由于作者试图对前人研究进行延续（见Jurgens et al. 2018；Teplitskiy et al. 2022）。

最近的一系列研究则通过将重点转移到产品中的特定文化元素或核心思想，提供了对新思想更为细化的识别。这类研究不是把整个产品作为观察和分析的单位，而是分析它们的组成特征，例如：歌曲的具体特征（Askin and Mauskapf 2017）或时尚的各个方面（Godart and Galunic 2019）；与文件相关的元数据，如类别、引用和关键词（Denrell and Kovács 2020; Fleming, Mingo, and Chen 2007）；甚至是文件中的具体词汇和短语（Carley 1997；Doerfel and Barnett 1999；Doerfel and Connaughton 2009；Hill and Carley 1999）。

从这个角度来看，新的元素甚至是旧元素的重新组合都会被视为创新，比如主题、关键词、化学品甚至是单词的新的组合（Foster et al. 2015; Galunic and Rodan 1998; Hofstra et al. 2020; Leahey and Cain 2013; Leahey and Moody 2014; Uzzi et al. 2013）。在科学中，新思想通常由概念或词汇来表示，这些概念或词汇通常在文章的论点中相互关联（Carley 1997; Hill and Carley 1999）。从这些文本的相互关系中，一个更大的概念网络（conceptual network）出现了，其中一些概念和概念的配对出现并获得频繁的使用，而另一些概念则未能站稳脚跟，逐渐淡化并消失。

关于科学知识体系的各种理论争论在很大程度上依赖于这种由思想组成的概念或语义网络结构（conceptual or semantic network structure），即一种将思想视作网络元素的视角。一般来说，相互关联的观念的网络或矩阵是这样的：既定的假设会对新的观念或新的观念关联产生影响（Fiegel 1970；Quine 1951；Toulmin 1972）。这意味着新思想往往是偶然的，它们必须建立和重申与先前思想的关系，否则根本就不会被承认：预先存在的科学知识的复合体（complex）或结构确立了它们的价值。例如，Fleck（[1935]1979）和Kuhn（1970）描述了思维方式和范式是如何抵制那些不符合既定思想的相互关系和假设的新思想和经验发现（另见Godfrey-Smith 2003, 2010）。进而，这可能会削弱一个新思想的影响力和传播力。相反，如果新思想出现并获得影响，它们可能会重新引导学界的注意力并改变现有的知识关联网络，导致概念关联的革命或重塑（rewiring）（Collins 1998；Kuhn 1970）。因此，科学研究一再发现，作为网络结构中的元素，新思想的成功与失败取决于它们如何调动和改变现有的概念关系（Callon 1986；Callon, Law, and Rip 1986；Latour 1987）。

因此，元素视角能够精确地识别并追踪具体的新思想的扩散，同时它也将新思想视作知识结构中的构件：新思想被引入、嵌入，甚至有时在知识结构中被重新构成。正是这种思想的概念化—一个更大的认知结构的构成要素—使得作者可以进一步论证其观点。

为什么新思想会扩散？

本文的中心论点是：思想有不同的发展路径，其中一些快速发展而另一些则默默消逝，其对于社会和思想背景的契合程度很大程度影响了它们不同的采纳程度（Denrell and Kovács 2020；Frickel and Gross 2005；Godart and Galunic 2019；Goldberg, et al. 2016）。特别是，我们认为，当新思想被具有社会地位更高的个人（Gerow et al. 2018；Goel et al. 2016）以及跨越不同合作研究社群的个人（Burt 2004；Moody 2004）所采纳时，它们会扩散得更多。同时，当新思想拥有持续的知识领袖，并获得长期坚持不懈的支持时，它们也会实现扩散（Merton 1968）。

但作者也认为，思想和它们的相互关系很重要。作者指出，一个新思想在科学知识和概念的累积（accruing）网络中的使用和所处位置会极大地影响其扩散过程（Gieryn 1978；Hallett等人，2019；Kuukkanen 2008；McDonald和Mair 2010）。当新的想法在知识层面产生共鸣时，它们就会快速发展：当它们与其他重要的概念相关，深处于集中的研究话语和思想风格中，并且在学术使用中达成了一致之后，它们会扩散得更多。

作者综合了科学思想史、科学和知识社会学以及管理科学的相关文献，厘清了这些因素对新思想的扩散倾向的影响，进而得到了以下假设*（编者注：出于可读性考量，此处删减了对于逐条假设的具体解读）：

假设1（社会重要性）：采纳新思想的作者社会地位越高，新思想就越能得到扩散。

假设2（社会一致性）：采纳新思想的作者越保持一致性，新思想就越能得到扩散。

假设3a（社会嵌入性a）：一个新思想越嵌入于密集合作的研究者之中，其就越能得到扩散。

假设3b（社会嵌入性b）：一个新思想越是广泛地涉及到不同的合作研究者社群中，其就越能得到扩散。

假设4（思想重要性）：一个新思想越是与重要的思想相连接，其就越能得到扩散。

假设5（思想一致性）：一个新思想连接的思想越是保持一致，其就越能得到扩散。

假设6a（思想嵌入性a）：一个新思想越是嵌入于密集联系的思想之中，其就越能得到扩散。

假设6b（思想嵌入性b）：一个新思想越是将互不连接的思想连接起来，其就越能得到扩散。

以上假设从要素视角出发，使得作者可以去感知并追踪新思想的采纳过程。但是，这样一种视角忽视了扩散过程与采纳过程可能是同步发生的（Callon 1986；Keuchenius et al. 2021；Latour 1987）。作者指出，在思想的不同发展阶段，以上因素对于思想扩散的影响是不同的。进而，在后文的分析中作者首先在测试以上假设时控制了时间的影响；随后，作者放宽假设，分析了思想的采纳过程（它们在各自的社会以及思想生态系统中的相互关系和位置）是否以及如何影响它们在发展早期与后期的扩散过程。

研究方法

实证背景：识别科学中的新思想

基于上文的讨论，作者将新思想概念化为语言中的新术语，并通过它们在发表论文中的采纳来表征它们的扩散。这种思想的概念化很适合科学学科，因为科学的结构及其假设的关系长期以来一直通过代表自然现象、方法、工具、任务和理论的词汇和短语在语言中进行联系（Herfeld and Lisciandra 2019；Kuhn 1970；Toulmin 1972；Vilhena et al. 2014）。科学家用来代表新思想的这些术语往往是名词和名词短语，它们指涉具体的科学内容（Kuhn 1990）；而这些术语往往在科学研究的摘要（包括标题和摘要）以及它们的贡献中被提及（Syed and Spruit 2017）。一些术语很少或从未被一起使用，而其他术语则相互依赖，揭示了核心概念和概念关系的存在。

Web of Science（以下简称WoS）从1900年到2016年的语料库是研究新思想扩散最理想的选择。该语料库由38578016篇文章中的70多亿个象征性词汇组成，这些文章涉及每个科学学科领域的期刊，横跨STEM（科学、技术、工程和数学）、人文和社会科学学科（HSS）及其它核心的专业化领域。

作为主要数据来源，作者分析了其中每篇文章的标题和摘要：作者应用数据驱动的短语分割算法AutoPhrase（Shang et al. 2018）来识别这些文章中最一贯（coherent）的短语，从而操作化思想的结构（详见图1和在线补充文件的S1部分）。随后，作者对这些想法进行后处理，删除明显是虚假的案例，并将连续的单词（unigrams）折叠成确定的多词组合（unigrams）（“social”“capital”=“social capital”）。作者共确定了624934个思想。由于1990年前后新思想呈指数级上升，并在1993年开始减速（见图2），于是作者选定1993年后的新思想作为样本，其中共有56540个新思想（约等于所有识别得到的思想的9%）。表1展示了不同领域中新思想的一些案例。

图1：从文本中生成概念描述的概念抓取管道（concept extraction pipeline）

图2：每一年产生的新思想数量

感兴趣的结果变量：新思想的传播

本文的因变量是新思想的扩散程度。作者用新思想首次发表后每年出现在不同文章中的数量（N篇已发表文章）来衡量新思想的扩散（如果新思想在一篇文章中出现多次，作者仅算作一次）。作者将因变量构建为一个新思想在未来一年（时间t 1）中扩散的文章数量。鉴于新思想在不同的年份出现并跨越不同的年份范围，这56540个新思想在年份层面上的观测值为995945。

平均来说，一个新思想一旦被提出，就会扩散到27篇文章中，其标准差则为49，扩散程度的范围则从0到4703篇文章。扩散情况严重右偏，这表明很少有新思想在科学界真正实现病毒性传染（图3）。图4a从1993年提出的100个新观点中随机抽取了一个子样本，并观察了它们随着时间推移所扩散到的文章数量。图4b则选取了特定的7个新思想，分析其变化趋势。这种不同的变化趋势促使作者提出了研究问题：为什么一些新思想比其他思想有更大的吸引力，以及为什么它们在一段时间内有如此不同的发展趋势？

图3：已发表文章中的新思想分布（因变量）

图4：思想的发展过程

关键预测变量及控制变量

本文的指标均来自于围绕新思想的两类社会网络：1）研究并阐释这一新思想的作者在社会网络中的特征；以及2）思想本身在与其他思想相联系的社会网络中的特征。作者在当年份测量每个指标（即比因变量晚一年），并对其进行纵向建模（即多层次增长模型[multilevel growth models]），以检验一个新思想的社会和思想情况是否能预测其后来的扩散程度。

社会重要性：作者使用一个新思想在时间t上所有作者的平均加权PageRank来衡量它的社会重要性。PageRank是一种对网络中心度的衡量。该指标基于过去10年内共同作者关系的网络，同时通过每个作者在时间t基于该新观点的出版物数量加权。此处加权的目的是为了更好地校准衡量标准，使最多发表新观点的作者更为突出（Bonacich 1987；Freeman 1978）。

思想重要性：我们用一个新思想在时间t上与之连接的所有原有思想的平均加权PageRank来衡量其思想重要性。该指标基于新思想在过去10年内发表的文章中与既定思想的相互连接所产生的社会网络进行计算，并以每个既定思想在时间t上与该新思想的连接数量为权重。

社会一致性：新思想的社会一致性被操作化为其作者在第t-1年使用关键术语发表文章的比率与他们在第t年时该比率之间的余弦相似性（cosine similarity）。只有在第t-1年发表论文的作者是本文所关注的群体，第t年的新作者则被忽略。因此，这是对过去作者一致使用该术语程度的衡量。如果t-1的所有作者在t年停止使用该术语，那么余弦相似度就为0；如果t-1中没有作者使用该术语，而t年有一些作者使用该术语，那么余弦相似度也等于0。

思想一致性：为了衡量一个新思想的思想一致性，作者计算了新思想在第t-1年时与既有思想共享文章数量的比率与第t年时该比率的余弦相似度。如果t-1时所有相关的思想都在t时停止关联，余弦相似度就变成了0。如果一个思想在t-1时间不存在，而它在t时间存在，那么余弦相似度就是0。与社会一致性一样，一个术语存在的第一年没有余弦相似度。

社会嵌入性：作者用过去10年（即t-9到t）所有在t时间点发表新思想有关论文的作者之间观察到的合作数量，除以这些作者之间可能的合作总数，来衡量一个新思想的社会嵌入性。该指标越高则表明新思想在一个合作的科学社群中更具有社会嵌入性；而越低则表明新思想被那些作为中介角色或跨越不同研究社群的作者所采纳。

思想嵌入性：为了衡量一个思想的嵌入性，作者为所有思想构建了一个前十年（即t-9到t）的语义网络（它们的连接为它们共同出现的已发表文章的数量）。这一语义网络代表了一个更广泛的科学知识情境。接下来，作者使用word2vec（Church 2017）将语义网络编码为一个具有200个潜在维度的嵌入空间（a 200 latent dimension embedding space）。这为作者提供了一个矢量的表示方法，概括地描述了每个既定思想在知识情境中的位置和相互关系。接下来，对于关键术语，作者首先确定了其在时间t的文章中共同出现的术语，并对每个术语对的嵌入维度进行余弦相似度计算。最后，作者计算出余弦相似度的平均值，从而得到一个指标。该指标越大，说明关键术语在既定思想网络中与相似语义术语的距离越近（或者反过来说，该数值越小，越说明其与语义相反的术语距离更近，或是更有可能作为文化洞[cultural hole]*）。

*编者注：文化洞，意指在文化产品或文化符号网络中桥接不同社群的节点（即文化网络中的结构洞）。具体可参考：Pachucki, Mark A., and Ronald L. Breiger. 2010. “Cultural Holes: Beyond Relationality in Social Networks and Culture.” Annual Review of Sociology 36:205–24. （中文译本见周怡主编《文化社会学：经典与前沿》）

另外，作者控制了以下变量：新思想起始年份与发展年限、词根、跨学科程度、专业学科、作者性别、期刊影响因子（取对数）、摘要长度（取对数）、摘要可读性（取对数）、摘要积极性与消极性、期刊摘要历史以及WoS内部引用数量。

统计方法

本文的分析有两个目标。首先，作者想了解为什么一些思想比其他思想更容易扩散。为此，作者以新思想在未来一年中的扩散程度为因变量构建模型，分析社会突出性、社会嵌入性、社会一致性、思想突出性、思想嵌入性和思想一致性对于扩散程度的影响。其次，作者想了解这些思想和社会情境对一个新思想扩散的影响是否取决于思想不同的发展阶段。为此，作者估计了新思想的发展年限与主要预测变量之间的交互项（interaction）。

由于思想的扩散严重右偏，作者使用随机截距的过度分散泊松回归模型（a multilevel [panel or longitudinal] version of the over-dispersed Poisson model with random intercepts）对其进行建模。同时作者使用负二项回归进行了稳健性检验，结果与泊松回归大致相同。

结果

思想与社会生态系统的影响

表1展示了社会与思想情境对于新思想扩散的影响。如表1所示，社会嵌入性每增加一个标准差，其扩散文章的预测数量就会减少15%。这个变量反过来说明了，作者在互不相关的社群中的影响力和桥梁作用会提高术语的扩散量。当新词与杰出的或核心的作者相关时，其扩散程度会有较小但显著的增加（社会重要性；b=0.05）；而社会一致性的影响基本可以忽略不计（b=0.02）。总的来说，这与本文的两个假设是一致的：当新思想拥有重要的作者（假设1）以及跨越不同的研究社群（假设3b）时，它们往往会更广泛地扩散。

表1：已发表文章中新思想扩散数量的多层次过度分散泊松回归（括号中为标准差）

值得注意的是，新思想生态情况的内在指标比起外在的社会指标更能预测它的扩散情况。一个新思想的思想一致性每增加一个标准差，它所扩散的文章数量就会增加53%。思想嵌入性和思想重要性的影响虽然较小但也在统计上显著。思想嵌入性一个标准差的增加会带来文章数量25%的增加；而其思想重要性一个标准差的增加会带来文章数量15%的增加。因此，与假设4、5和6a相一致，当一个新思想获得思想上的共鸣时，它就有可能在更多的文章中被采纳。这种思想上的共鸣包括：当作者将其与已经确立的思想相联系时；将其与具体的、重要的思想相联系时；将其置于公认的核心研究主题和范式内时。总之，这表明一个新思想的成功取决于它与既有知识的特性和内容的关联。因此，平均而言，当新术语在语义空间中被持续且有说服力地使用，与其他核心思想相联系，并在作者群体中得到广泛使用时，它们会获得更大的扩散和采纳（Goldberg et al. 2016）。

思想的采纳过程*如何影响后来的扩散过程？

*编者注：此处原文为“Adaption”，但结合上下文来看应该为“Adoption”，即“采纳”而非“适应”。

表2和图5的结果反映了关键变量和发展年限之间的交互项，其回答了社会和思想条件对于新思想的不同影响是否取决于其发展年限。表2的结果以表1的模型4为基础，对关键变量逐一进行交互项。图5则以多层次过度分散泊松模型的预测值绘制交互作用（Keppel 1982；McFarland 2001），其中x轴代表1至23年的思想发展年限。y轴则代表发生率比率（incidence rate ratio，即一个思想每年的预测新文章数量）。

表2：社会/思想条件与发展年限的交互作用（括号中为标准差）

图3：交互作用：不同关键变量与发展年限情况下的术语使用预测比率

图5中的a、b、c（表5中的模型1、2、3）显示了相关作者的社会状态如何改变一个新思想的扩散过程。特别值得注意的是社会嵌入性：一个新思想在其发展的后期，随着作者与距离较远的社群之间的沟通和联系（低社会嵌入）而反而被越来越多地采纳。如果社会嵌入性降低一个标准差，那么在该术语的发展早期（第1年至第7年），每年可能会增加一篇文章的扩散；但在后期（第21年至第23年），低社会嵌入性会增加超过15篇文章（见图5b）。相比之下，社会突出性和社会一致性的影响则明显较小，而且只在思想发展的后期对扩散有所影响。

在图5的d、e和f（表2的模型4、5和6）中，作者分析了思想条件是如何改变一个术语在文章中的采纳率的。一般来说，思想条件的影响程度始终比社会条件的影响程度强。这可以从表2的系数和图5中不同线条的差异中看出——在大多数的术语发展年限中，线条之间的距离通常更远。思想一致性一个标准差的变化可能会使术语的采纳率在术语的早期（1-7年）和后期（21-23年）每年增加15篇扩散文章（见图5f）。

新思想似乎也受益于处于一个固定的研究主题或思想风格中（例如语言和言语[langue and parole]，见Saussure 1916）。思想嵌入性一个标准差的变化可能会使术语的采纳在思想的早期（1至7年）每年增加一篇额外的文章，并在后期（21至23年）增加10篇文章（见图5e）。在作者的分析中，当一个思想被有意义地嵌入到一个研究传统、主题或话语中时，就会出现这种情况（Heiberger et al. 2021）。思想重要性的影响则不那么关键，但它在一个术语的前23年里似乎仍然很重要。将一个思想与核心概念联系起来会在思想发展的后期产生较大的影响。随着一个新思想逐渐变老，思想重要性一个标准差的变化会在第21年至第23年间每年增加5个文章的采纳（见图5d）。

案例讨论：基因本体论（Gene Ontology）的成功

值得注意的是，所有对新思想扩散的影响都随着发展年限的增长而更加明显。如何解释这种延迟效应？Lamont（1987）认为，理论的合法化更多来自于复杂的环境作用，而不是理论本身的内在质量。基于这种洞察，一种可能的解释是，科学思想需要时间来获得思想和社会的共鸣，并在学术界扩散。Schudson（1989）将“共鸣”定义为一个对象与“受众的生活”相适应的程度。McDonnell及其同事（2017:3）则将共鸣概念化为一种体验，这种体验随着人们“解开或’解决'实际情况的行动”而发展。所有这些关于共鸣的概念都表明，一个想法需要发展和时间，以使其被认可。

作者以一个新概念的实证案例作为此处讨论的基础。例如，“基因本体论”是生物和健康科学中的一个明星概念，表现出了本文统计模型所识别出的许多特质。“基因本体论”在1999年首次使用，而在2016年，它扩散到了907篇发表的文章。“基因本体论”指的是层次相关（hierarchically related）的生物术语词汇，用于描述基因产物或表达基因所产生的生化物质的特征。在“基因本体论”这个术语被发明之前，生物学家有独立的本体论来描述不同的物种和它们的基因产品，这使得关于基因功能的交流、综合和跨物种推断难以确定。

建立基因本体论的努力始于1998年，当时一群研究人员组成了基因本体联盟，为酵母、果蝇和小鼠的特定物种开发基因本体（Ashburner et al. 2000），很快便在WoS上发表了文章（Ashburner et al. 2000；Gene Ontology Consortium 2001；Jenssen et al. 2001；Lewis 2005；Shaw et al. 1999）。此后不久，研究人员对许多其他生物体的基因本体进行了探索，并开始了对现有本体的阐述，使其与数据库中的基因/基因产物相互关联，并促进更一致的基因本体的使用和发展。从那时起，基因本体论的研究不断扩大。简而言之，它从几个物种的重点应用开始，发展成了一个更大的框架和工具，用于更广泛地识别基因功能。

作者也在数据中看到了基因本体论发展的证据。在最初的几年里，这个词被较为模糊地使用，而随着时间的推移，它被凝聚成一个广泛共鸣的概念。在这个概念出现的第一年（即1999年），它只有七个相邻的概念，如基因组数据库（“genom databas”），生物过程（“biolog process”）和基因产品（“gene product”）。随着基因本体论在2016年扩散到近1000篇已发表的文章中，与之相关联的思想数量从7个增长到19935个。

为了说明它的思想和社会生态是如何随着它的扩散而发生变化的（以及这对它后来的扩散有什么更大的影响），作者绘制了2007年和2016年与基因本体论最频繁共同出现的前20个邻居。图6中的a、b、c显示，关键概念和其相邻社群之间的联系在数量上有所增长，变得更加密集，这表明基因本体被用于一个较为聚焦的研究主体和思想风格。这反映在思想嵌入性的数值上。同时，作者也在思想一致性指标中看到这一点，它从0.51增长到0.98：在后来的几年中，基因本体论越来越多地与其他相邻的概念，如基因组数据库（'genom databas'）、蛋白质（'protein'）和转录组（'transcriptom'）以一种更为一致的方式进行使用。同时，随着时间的推移，基因本体论越来越多地与其他核心概念，如蛋白质、基因和数据库相关联，因此思想重要性从1.0增长到3.4。

图6：社会与思想条件变化之下的概念案例（红色节点为“基因本体论”）

基因本体论的研究群体也自其推出以来不断壮大。1999年，11位作者合作发表了第一篇研究“基因本体论”的文章；到2016年，基因本体论的研究社群已经发展到6154个。我们绘制了2007年和2016年最常采用“基因本体论”术语的前50名作者。图6中的d、e和f显示，随着时间的推移，关键概念和学术界之间的关系变得更为分散了。作者在社会嵌入性的指标中也看到了这一点，它从1999年的1.0下降到2016年的0.0009。这表明，随着时间的推移，跨越更多的研究社群有助于一个想法更广泛地扩散。

本文还关注到一些关键的作者持续地将基因本体论作为一个课题来研究。例如，剑桥大学的遗传学教授Michael Ashburner从1999年到2009年持续发表了关于这个主题的多篇作品。这也反映在社会一致性指标中，其范围从0.00发展到0.74。而随着时间的推移，基因本体论也与生产力更高的作者产生了关联：社会重要性从1.0增长到1.4。思想和社会的条件共同帮助了基因本体论的发展，这一概念对于生物学变得越来越关键。随着这些思想和社会条件的发展，这一新思想随后的扩散变得更加巨大。

总结

本文的发现阐明了一个新的科学和学术思想的发展故事：它们最初仅仅只是作为具有初步意义的术语，而其随后的广泛扩散取决于它们与知识体系相关的意义符号是否被制定（worked out）、系统化（systematized）、详细化（elaborated），并在不同的研究团体中广泛分享。只要这些术语被后来的研究者阐述、采纳和拥护（championed），它们就会被更广泛地认为是可移植的思想，这就像拉图尔（Latour 1987）描述的事实或是机器。这个思想会逐渐开始弥合结构洞（structural），与不同领域的作者接触。这些作者会根据自己的需要对术语进行翻译和调整（Perry-Smith and Mannucci 2017），进而可能使新思想成为一个边界物体（boundary object），其尽管与同一主题有关，但却被每个社群有选择地解释和独特地使用（Fujimura 1992；Star and Griesemer 1989）。这样一来，一个最初狭窄的想法可以发展成一个具有多种公认的离散意义和应用方式的概念，同时在不同社群中被实践，而不会破坏其意义。

一个思想可以在科学知识的网络中积累更多的相互关系，与其他预先存在的核心概念有着紧密的联系和关联，从而成为一个核心概念。通过这种方式，新思想作为具有模糊意义的关键对象进入知识界和社会界。有些思想获得了知识和社会的生态条件，扩大并凝聚了自身的意义，进而将自己固定在研究传统中；而其他想法则在学术文本和生活中都飘忽不定，无法引起共鸣。

作者之所以能够发现这个不同往常的故事，是因为其同时强调了思想和社会生态。现存文献往往倾向于从分析上排除一个，来系统地分析另一个。通过同时分析二者，作者看到了制约新的科学事实的社会因素，同时也突出了科学本身逐步变化和发展的内部条件。事实上，正如理论折衷主义帮助作者更完整地分析了科学的发展，作者对思想作为文化产品的要素的分析则为高保真的系统实证分析提供了动力，观察到了近60000个新思想的出现并追踪了它们在随后20年中的发展过程。

因此，本文可以在此对思想本身作出解读，正如它们在最初被介绍给整个科学界时就被阐明了：作为表达新的、进步的、科学的意义的独特而分离的术语（unique and discrete terms expressing newly advanced scientific meaning）。在这方面，本文的贡献是对科学的结构提供了一个独特且详尽的观点，而并非简单的几个试金石、明星思想或人物细节（Stinchcombe 1982）。正因如此，本文的分析提供了更为普遍的洞察，而不是像以前那样专注于关键的思想、文献引用或文化产品。最后，本文的方法深受关系视角的影响，使作者能够看到科学结构演变中的历史偶然性和路径依赖性。思想与其他思想以及写出思想的人都是有关系的；思想不是静态的，人们如何使用它们也不是静态的。这些关系随着时间的推移发生变化，对后来的成功具有很大的影响。

编译 | 洋芋

审核 | 霰雪

终审 | Krystal