文献引用的可控与不可控

检索贩子 2008-03-04

展开全文

武夷山

（发表于《科技导报》2008年第4期）

管理学告诉我们，要将时间和精力用在可控（可管理）的因素上，对于不可控的因素，阿弥陀佛，随他去吧。同样的，文献引用也有可控和不可控两个方面。可控的是：我们引用谁的文章；基本上不可控的是：我们的文章是否会被引用，又是被谁引用。当然，同行朋友之间有意识地相互引用，是可控的；导师暗示或明示学生引用自己的文章，也是可控的。不过，这种做法怎么评价呢？既不能将其视为不轨行为，也不能将其视为非常规范的引用行为。它落在灰色区域，我不知该怎么说。

英国巴斯大学经济学与国际发展系的John Hudson教授做过一次很有趣味的文献计量学研究。他以《美国经济学评论》和《经济学杂志》这两种经济类顶级期刊上1981年至1997年发表的所有论文为样本，试图发现引文与哪些因素有关。第一，他发现，论文的页码数越多（篇幅越长），则越容易被引。（笔者评注：看来，人们对份量重的论文更可能肃然起敬，从而加以引用。）第二，假如你的论文是整本期刊的第一篇，则在5％的显著水平上，更可能被引用。（笔者认为，很多编辑部将他们认为质量较好的论文放在第一篇，那么，它获得较多被引也正常。另外，这里也不能排除发生心理学上所谓“初始效应”的可能。正如我们对很多歌曲、诗词的第一句都记得很清楚一样，排在第一篇的文章也会给我们留下深刻印象。）第三，被引总量随自引的增加而增加。（笔者对这一结论有点怀疑，最好用格兰杰因果检验来看看孰为因，孰为果。在总被引量很大时，其中也包含较多的自引，这是很正常的。但是，自引是否会导致他引？则需要进一步研究。）第四，最有意思的是，含有高被引论文的那一期，其他论文也沾光了，其被引量也跟着提高。这就好比，我是冲着大明星巩俐才去看《秋菊打官司》的，看完之后，又记住了本来不熟悉的刘佩琦（秋菊丈夫扮演者）。［1］唉！要是我的论文与名家的论文发表在同一期该有多好呀！但这是我不可控的。这项研究表明，文章被引用牵涉了不少偶然因素，因此，被引用未必就表示论文质量高。我们的论文即使被频繁引用了，也用不着飘飘然。

有人就天体物理学文献的阅读量和引用量做了定量分析后发现：一篇文章被天体物理学文献数据库的用户平均阅读7次，就可能获得一次引用。［2］这是可以理解的。你的文章再好，如果人家读都没有读过，怎么可能引用呢？（当然，少数作者自己不好好地多阅读一些文献，却从别人文章的参考文献清单中转抄一些作为自己的参考文献，这种不良行为确实与阅读量无关。）因此，如果你的文章是在免费的开放文档中，能被更多的人读到，那么。被引用的概率似乎应该加大。是不是这样呢？美国两位学者作了一项文献计量学分析，他俩考察了1997－2005年期间在四种数学期刊上发表的2765篇论文，看看其中同时也放在arXiv开放文档中的论文与未放入该文档的论文相比，被引次数有什么变化。结果发现，放入开放文档者，平均被引次数要多35％。对于高被引论文，则放入与不放入arXiv导致的引用数差异更大。［3］

对于开放获取（OA）期刊论文的被引次数较高（也有一些人坚持说，这一事实并不成立）的解释，主要有两种。一个解释，由于OA论文是免费的，阅读的人就多，从而文章被引次数也相应增多；另一个解释是，电子版期刊（所有OA期刊都是电子版的）比纸质本期刊要早面世，读者先睹为快，从而也会更早地加以引用。前述两位美国学者不同意这两种解释，他俩对放入arXiv的论文的被引次数要高出35％这个现象的解释是：很多作者并没有将自己的所有文章都放入arXiv，而是将自己认为质量较好的文章放进去，这才导致了差异。即使他俩的解释是对的，但也不可否认：arXiv平台的方便性和允许免费利用，确实有利于论文被引。这样的话，作者对于自己文章是否能获得引用就增加了一个相对可控的因素：多向OA期刊投稿，多向机构库（Institutional Repository）存放文章吧。全世界的作者，OA起来！

有的作者为了提高自己投稿被采用的概率，就有意识地多引用他们所投稿的那家杂志的主编与副主编的论文，以博取好感。［4］在国际科学计量学界，将学术期刊的主编、副主编及编委会成员称为期刊的把门人（Gatekeeper）。人们认为，学术期刊的把门人应该具有较高的学术水平，了解本领域的研究前沿，对来稿中是否包含有创新思想有着敏锐的感受力与判断力。因此，匈牙利著名科学计量学家布劳温及其同事设计了一个新指标，叫把门人指数。其定义为：某个把门人的论文在某年的被引次数与此人在过去两年内发表论文总数的比值。可以看出，这个定义类似于影响因子的定义，只不过，影响因子是针对期刊的，把门人指数是针对人的。布劳温等选择了若干领域中影响因子较高的期刊，将其主编、副主编、编委会成员的名字采集下来，做成了把门人数据库。该库涉及的期刊有480种，把门人有大约13，000名。他们认为，把门人指数应该比他们所把守的那个期刊的影响因子要高，才是比较正常的，才能体现出把门人是高水平的。他们用纳米研究类的刊物作了分析，结果发现，只有一种刊物的把门人指数低于刊物的影响因子，其余刊物的把门人指数都高于刊物的影响因子。［5］

我国迄今还没人算过中国期刊的把门人指数。如果我们谈到的那种作者有意识引用把门人文章的现象比较普遍，则中国的把门人指数容易获得一个较高的值，但这并不意味着中国的期刊把门人学术水平真的较高。我作为《情报学报》的主编和《中国软科学》的常务副主编，已经发现自己的文章多次被不必要地引用了（我的被引文章与引用者的文章没有太大的联系）。这也是一种不可控的被引，而且是令人悲哀的不可控。

参考文献

［1］ John Hudson, Be known by the company you keep: Citations—quality or chance, Scientometrics, 2007, 71 (2): 231-238

［2］ Michael J Kurtz等，The bibliometric properties of article readership information，JASIST，2005，56（2）

［3］ Philip M. Davis and Michael J. Fromerth, Does the arXiv lead to higher citations and reduced publisher downloads for mathematics articles, Scientometrics, 2007, 71 (2): 203-215

［4］潘云涛，武夷山，自引、他引：说不尽的故事，《科技导报》，2007，25（24）：85

［5］ Tibor Braun et al., Gatekeepers Index versus impact factor of science journals, Scientometrics, 2007,71(3): 541-543