分享

英文文献数据库检索技巧:以WOS和SD为例

 叨叨道 2022-07-06 发布于河南

本文根据赵培玲的讲座视频整理而成,文稿未经专家本人审阅。图片

作者简介:

赵培玲:美国南佛罗里达大学博士,米利肯大学终身副教授,中南大学外国语学院特聘教授。《外国文学研究》审稿人、国家社科基金中华学术外译项目评审人、全国学位论文评审专家、教育部人文社科项目评审人。主讲《外国文学研究方法》《学术论文写作》等研究生课程。


图片

今天,我们讲数据库。首先,我们对一些常用的英文文献数据库进行了解,再从主要特征与基本功能、检索技巧、文献追踪、关键词与领域专家追踪等几个方面对“Web of Science”数据库展开详细介绍。

图片

一、英文文献数据库简介

(一)文献数据库中的文献信息构成

英文文献数据库里的文献信息最基本的单位叫作“记录”(record),由篇名、作者、主题等字段组成。很多人希望,比如,“我”把一句话放进数据库进行检索,这句话里就涵盖了太多信息。所以,我们一定要想好这些关键词、篇名、作者和主题这种字段构成。每一个字段,又分成若干个子字段。数据库就是由一系列连续的子字段、字段和“记录”构成的、分级的树型结构。

(二)文献数据库分类

数据库的分类包括:全文数据库、数目数据库、数值数据库、术语数据库、图像数据库、音频数据库和视频数据库。我们大部分时候需要的是全文数据库。之后,我们有可能需要再检索术语、图像、音频以及视频数据库。

(三)常用英文数据库

在我们常用的英文数据库里面,如果是做比较跨学科的前沿研究,首选的是Web of Science。如果你想要大量的这种实证研究、量化研究,那么我们选第三个Science Direct,我们文科有相当多的这种高质量的论文就在Science Direct里面。如果你是大文科类的,EBSCO ASP就是我们的首选,它是大文科科研数据库。ProQuest是一个英文的硕士论文和博士论文综合数据库,它里面以学位论文为主。然后是Taylor and Francis Online,这里面有大量的期刊论文和电子图书,还有一些比较早期的历史资料。下面一个叫JSTOR,它的全称是Journal Storage,它是针对一些国际上比较有名的、质量很高的期刊,把这些期刊从第一期一直到最近的一期始终和纸质版本期刊保持一模一样的版本。Wiley Online也是一个跨学科的的数据库,这里面会收录顶尖的、顶级的期刊。Springer数据库除了期刊论文,它更擅长的是收录一些电子图书、工具书。最后一个是SAGE Journals。SAGE Journals和JSTOR都一样,收录的期刊论文不是最新的,但都专攻的是期刊。尤其是SAGE Journals,对我们大文科类的期刊收录地相当得全。

英文数据库能够让我们大量甚至是海量地获取前沿的、系统的、完整的学术文献信息。我们能够通过这些数据库,比较系统地对前沿学术信息进行掌控。这些英文数据库对于我们论文写作过程的选题、研究方法、打造框架以及论证都具有相当大的意义,且对于论文发表过程必不可少。我想大力地鼓励一下大家,在国内发表学术期刊论文比较紧张的情况下,大家可以自信地尝试着选准一个国外期刊,将论文发到国外。

二、Web of Science数据库主要特征与基本功能

Web of Science数据库又叫“母数据库”。它大量地将期刊收录其中,故有人称之为“Master Databases”或“Mother Databases”。它最大的特点是跨学科性。如果你要做一个主题,通常建议首先到Web of Science“遛一圈”,看它里面能否给出一些帮助。它里面覆盖的学科是最多的。有时候,你也可能会看到刚刚出来的期刊或者是和研究话题相关的期刊。它有信息量大这个特点,时间跨度也大,跨了100多年。但是,它又有一个不好的特征,有时你只能在该库看到一篇论文的题目或摘要,却看不到全文。但你一旦知道有人在这上面做了最新研究,就已经是一个很大的收获了。

首先,被引的参考文献可以在上面检索。比方说,你在一本英文期刊上发了文章,它可以帮你去检索“是谁在引用我的文章”。然后,它还有检索所有作者以及作者附属机构的功能,以及跟踪服务、引文报告、检索结果分析和与文献管理软件Endnote无缝对接,可以创建私人文献库。

其实,像跟踪服务与私人文献库功能,其他数据库也有。但我想强调的是,在面对海量文献时,我们要做的不仅是把它检索出来,更多的是要管理这些文献。并且,在管理的基础上,我们把文献进行分类,在分类的基础上,再去筛选出和你直接相关、同时为我们以后查找文献有帮助的内容。数据库并不是为我们的一篇文章去查找与之有用的信息,而是为我们以后写作其他更多的文章或研究更多项目时,查找出相关的文献出来。这样,我们的时间才花得值。

三、Web of Science数据库基本检索技巧

(一)被引参考文献检索

支持通过关键词、作者、标题、学科领域和“DOI”(digital object&identifier number,是指“数字对象唯一标识符”)这几个要素来检索。例如,我拿自己的名字进行检索,直接将我的名字放到“被引的作者”一栏,它给我显示了“被引最高的文章列表”。其中,被它收进来的、引用最高的就是“AGGRESSEVE BEHAVIER”,它是我跟一个Social Science Professor合作写成的,是我在美国时做的一个实证研究。

接下来,它还会帮你做一个具体的、每一篇文章是谁引用你的,都会给你做出标识,并且给我们呈现了“检索结果分析”柱状图。在此基础上,数据库还做了一个引文报告。如果你自己感兴趣,可以慢慢地去看,一本期刊在某个阶段,它为什么处于不被人关注的状态?一篇论文缘何出来以后,当年并未被人关注到,但随着时间的变化,某一个话题被大家关注的程度会慢慢提高?随着时间的推移,为何又会逐渐地变弱?

(二)基本检索技巧

1.不支持句子检索

有的时候,你把一个句子放进去,对它来说没有啥意义,反而会干扰它。那么,我们常见的检索关键词就是我们的主题、作者、标题、学科领域和“DOI”,甚至年份、来源(出版社或期刊)。

2.大部分的数据库不区分大小写

比方说,“shakespeare”和“SHAKESPEARE”检索结果一致。

3.字段标识是Web of Science特有的

如果,你想要很接近理想的检索结果,就按照它的已供你知道的那些方面的信息给它输入再下指令,它就会检索出你需要的文献。

4.“检索运算符”(又称“布尔运算符”)的运用

包括“AND(与)”“OR(或)”“NOT(非)”“NEAR”和“SAME”这几个符号。其中,我们用得最多的就是“AND”(意为“用多个关键词限定”)”。比如,你放“china film”,如果就放这两个词、不加“AND”,和你放“china and film”、加了“AND”这个词,出来的文献是不同的。因为,你放“china film”,本数据库就会单独地将只要包含了“china”的文献和只要包含了“film”的文献都会给你呈现出来。但如果你想研究的是“china and film and history”,一加“AND”,那么,出来的数据就会更加相关。我们知道,数据库里的东西是海量的,我们需要的是尽快地检索到我们想要的文献。

依次类推,我们可能大部分人不会用“OR”和“NOT”。“NOT(用关键词(作者、学科、年份等)排除)”是在你的第一次检索之后,如果出现了几十万本文献,你感觉太多了,那么你要采取一种办法,可以用一个“NOT”。“NOT”是表示可以不要某一个作者。或者说,有时候作者同名,你也要把他排除在外。比如说,作者的last name和first name,即当作者的姓、名相同的情况下,如果中间还有一个middle name,你可以把它排除。或者,这个人是同名同姓,但是他们的学科领域不同,那么你也可以尝试排除一些学科领域。或者你给他限定一个年份,比如,“我”只要这个人2009年到2019年这十年间的资料,或者也可以设置成“我”不要这个人从1975年到1995年之间的资料,我们能够通过这种方式来进行排除。

5.通配符(*?$)和括号的运用

运用通配符,能使我们不会漏掉一些重要的检索结果。例如,“*”,再比如,“child”,你想查找一些和“儿童”相关的文献。因为“child”这一英文单词也可以写作“children”,也可以写作“childhood”或者说和“child”相关的其他一些词。那么,我们加上“*”在“child”的后面,它就可以将全部的、根据与“child”相关的几个关键词检索到的所有文献呈现出。还有一个是“?”,有时,在看完一些英文文献并将其翻译成中文以后,我们不确定能否把它还原到英文拼写状态。当我们不太确定的时候,如果前面几个字母已经确定,可以采取加一个“?”的形式,它会给你加一个和它相关的、例如刚才我们举的例子,可以帮你查找出来。此外,还有“$”(美元符号)。由于英式英语与美式英语的拼写不同,有时会导致一些文献在检索过程之中被漏掉。所以,我们用“$”这个符号在中间将在英、美两种语境下拼写有颇大差异的单词标注出来后,不管哪个拼写,它都能帮你检索出来。例如,“flavo$r”可用以查找“flavor”和“flavour”。

(三)基本检索尝试

我的专业是修辞,即“rhetoric”,我就简单地举个例子,就检索“rhetoric Chinese”。

图片

我们检索到的文献有几十万篇,一下子就出来了。我们下面要做的就是,自己把它慢慢地精炼。我采取了一种方法去精炼文献,就是“精炼”数据库,因为我只要wed of Science的核心合集,也即最主要的文献。比如,页面左侧的KCI-Korean Journal Database数据库中的相关文献我想把它筛选掉。但是,如果你碰巧觉得它很有价值,也可以单独选它。然后我们再选研究方向,我把研究方向聚焦在语言学、文学和“Arts Humanities Other Topics”三个范畴之中,它就给我们精炼了很多。

四、高级检索技巧

我刚才用的是rhetoric chinese这两个词,再将主题词改为rhetoric。有时候,检索文献就是看我们怎么去设定关键词,不要想着它永远是一成不变的。我尝试着用它的高级检索,我按照它右边的字标、字段标识,遵照它给出的提示符进行检索。比方说,“TI”,“T”就是“title”(标题),我给它标成“Chinese”。就这样,我们检索一下会得到什么结果。我们发现,它的数据和刚才的有重叠的、也有不同的。当然,如果你已经有一些更好的关键词或者是来源期刊,你可以自己去进行高级检索。这就跟玩游戏差不多,可以自己去尝试一下。

五、文献追踪服务

你今天检索过了一遍以后,锁定好了关键词。我们的关键词假定是“自闭症儿童”(autism Child)。我们先在网页上进行注册,它是免费的。然后,它会把我们的邮箱地址记录下来。之后,我们就可以创建跟踪服务,它就会定期地、几乎每天地给我们推送和我们的研究相关的文献,让你在没有打开数据库的时候,也可以把握最新的检索结果。这个账户登录以后,你还可以把你的参考资料和Endnote library进行绑定,提供一个私人的Endnote library给它,它可以给我们导入过去。同时,Web of Science每年还会提供学术期刊论文SSCI的影响因子的变化趋势呈现,每年都会提供这样的数据,我们也可以到这里去检索期刊的影响因子变化。

六、关键词

在学生给上英语学术论文写作课的时候,经常有学生问我:“赵老师,我的数据库里找不到跟我相关的。”慢慢分析,就是他有很多认知上的偏差。正如“你的主题词就是你的问题”。其实,也不完全是这样。主题词可以是你的文本、语料,也可以是研究问题、也可以做研究用的理论、概念。这个主题词,我们可以把它理解成写论文的几大块。例如,我们研究莎士比亚,不能就想着“我就真的只研究莎士比亚”。莎士比亚可供我们研究的主题特别多,当然不愁文献。总体而言,你可以给主题词找近义词、同义词作为新关键词。我们查找出来以后,它就会为我们呈现出那些被漏掉的文献。或者,我们用主题词的分类,比如说,我如果检索“emotion(情感)”,这个词它是一个很泛的、包括几百种的“emotion”的词语。我用这个主题词下面的、从范畴来讲比它小一些的词,比如“shame”是其中一个,或者是“fear”,这都是研究得比较多的。当然,我们也可以采取把主题词分成几个成分、几个要素,或者与它相关的其他词作为新的关键词的方式来检索,或者用主题的相关期刊来检索,或者用文献里的文献作为新的关键词。也就是说,我们可以找到一篇高度相关的文献,然后在文献里面去找专家的名称、期刊的名称或者是理论的名称,诸如此类。这个过程是一轮又一轮、不断反复的,是一种循环的、滚动的、向前的探寻。我们不能里面出现了这么多,就宣告结束了。这样的游戏,玩起来也没什么意思。

七、追踪领域专家

某一个主题相关的专家,如果称为专家,肯定就不会只发表过一篇文章,肯定有其他的文章。我们可以采取以专家的姓名作为关键词,或是到某个领域里去重点检索的方式。这样一来,我们的文献检索就更聚焦一些。我经常建议我的学生,如果你是刚刚起步,你的主题词与关键词没有那么多换来换去的可能,就到文献综述部分找一篇高相关的论文,去看文献综述。在此,强烈建议大家看博士论文,博士论文的文献综述部分就可以一下子给你带来许多有用信息。当然,如果他综述做得好的话,就会让你看到就某个话题、这个领域里面的来龙去脉的、理论家们主要探讨的主题词下的热点词,还有一些专家的名字,就全都呈现出来了。这样,我们就能靠自己通过阅读文献综述提炼关键词。同时,有一些可能你觉得对它感兴趣、但是和你的主题一下子看不出有高相关的文献,也不要把它扔了,它可以为我们新的论文或项目物色一个方向。因为,我们做完一篇论文以后,还会产出其他的、新的研究问题或者方向。而经过这一过程,新一轮检索关键词就诞生了。

编辑:科研小编
请尊重原创

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多