当今数据大量增长促进信息科学蓬勃发展,文献是科学传播的主要媒介,一定程度上反映了科技增长规律。想了解特定领域发展历史、进程与趋势等规律,首先要建立相关文献数据库。本文以Web of Science数据库为例,以径流某相关领域为检索主题,详细讲解Web of Science文献检索和下载,文献数据导入R环境,建立文献计量分析数据库,以便后续分析。 1.进入WoS界面 图1 Web of Science 文献检索界面 图1中红色区域是主要操作区域。框1:选择数据库;框2:检索内容输入与设置;框3:检索时段设置;框4:子数据库等选择 图2 数据库选择 框1:下拉菜单,选择所需数据库,本文选择Web of Science核心合集(可以输出全纪录和参考文献);框2:所选数据库简介。输入检索内容之前,我们先点击“检索提示”,查看检索规则(重要,建议仔细阅读),阅读完毕后返回检索界面。图3 检索规则 4.返回检索界面: 图4 检索界面 一级检索方式有5中:基本检索、作者检索、被引参考文献检索、高级检索和化学结构检索。这里选择“基本检索”即可。接下来,首先设置二级检索方式。下拉主题框菜单,框1显示检索方式内容,框2为所选检索方式的简介及示例。也可以点击“进一步了解”,详细了解所选检索方式的检索规则。如果需要增加检索条件,可点击“添加行”;如需要重新检索,可点击“重设”。本文中选择“主题”检索,检索条件:根据特定领域关键词进行检索(框3,本文未展示)。5.检索时段选择 图5 检索时段选择 框1下拉可以选择根据需要选择检索时段。例如想了解近年来研究最新进展,可以选择“最近5年”;查找最新发表文章,可选择“最近2/4周”等;想了解本领文章发表历史及规律可选择“所有年份(1990-2020)”。本文根据研究需要,选择“自定义年限范围”,即跳转到框2,选择年限:1969-2019。6.子数据数据库选择 图6 子数据库 框1显示了7中子数据库,本文选择SCIE和CPCI-S2个子数据库。根据条件精炼检索:文献类型,文献机构,文献时段等。图7 检索结果1 图7 展示初步的检索结果。框1为根据条件获得的检索文献总数;框2为按不同指标查看检索文献列表;框3为检索文献结果列表;框4为进一步检索条件,即精炼检索。精炼检索包括高被引论文、开放获取、出版年、类别、机构、文献类型等18个指标,可根据研究需要对文献搜索结果进行精炼。本文对“文献类型”进行精炼。图8 根据文献类型精炼搜索结果 点击框1“更多选项/分类…”进入右边界面,选择需要精炼的文献类型,本文选择前3项(框2),最后点击框3“精炼”。图9 检索结果 通过精炼检索,最后检索到392篇文献(框1)。可以点击框2中“检索历史”查看整个检索过程,确认无误后,准备导出检索结果。检索结果的导出方式有2种(框3),第一种是较为简便的“A 导出…”;第二种先“添加标记结果列表”,之后再导出(此方法能够了解更详细的导出细节)。我们先以第二种方法为例,向大家展示数据导出的过程。图10 结果导出(添加列表方式) 首先点击框1,弹出对话框2,填写“记录来源”1-392,点击“添加”,最后结果显示为框3。然后点击“标记结果列表”,进入标记结果界面。图11标记结果界面 首先在框1中选择“本列表中的所有记录”。第二步,框2中的内容“全选”。第三步,点击“A 导出…”,弹出对话框选择“其他文件格式”(框4),弹出对话框5,选择“纯文本”,点击导出,文献信息即成功导出。此种方法提供一个详细的导出细节和流程。第一种方法非常简单,无需添加列表。先点击图9中框3“A 导出…”,弹出图11框4对话框,选择“其他文件格式”,弹出对话框(图12)。填写记录来源,选择“全记录与引用的参考文献”,文件格式为“纯文本”,最后点击导出,导出结果与第二种方法结果一致。图12 导出结果至文件 到此,数据导出完成,即完成了所需数据的下载,下载文件名默认为“savedrecs.txt”。 图13 R环境与数据导入、格式转换代码(框1) 1.加载包 library(bibliometrix)#加载包 2.#读取数据
D <- readFiles("E:\精鼎统计\savedrecs.txt ") readFiles: 加载一系列ISI或者Scopus输出结果文件,格式为“large character”(大字符集)。 3.#数据转换成数据框格式 M <- convert2df(D, dbsource = 'wos', format = 'plaintext') 4. 运行结果: Converting your wos collection into a bibliographic dataframe # # Articles extracted 100 # Articles extracted 200 # Articles extracted 300 # Articles extracted 392 # Done! # Generating affiliation field tag AU_UN from C1: Done! conver2df: 将WoS或其他数据库格式转化为数据框格式。 file: 字符数组:WoS导出文件(plain text(纯文本)或bibtex格式 );Scopus导出文件(bibtex格式);pubmed类对象(RISmed)。dbsource: 字符,表示数据来源,可以是“isi”, “wos”, “scopus”, “dimensions”, “pubmed”,默认是“isi”。format:字符,表示文件格式,可以是“bibtex”,“plaintext”,“csv”,“excel”,默认是“plaintext”。本文以Web of Science数据库为例,详细讲解了文献检索和下载,数据导入R语言环境。下一次,我们将为大家介绍文献计量学中的主要指标和bibliometrix包中对主要指标的描述统计分析功能。---文献计量学专题上期推荐--- 点亮再看,后续更加精彩哦!
|