分享

R语言文献计量学2-某领域文献检索、下载与导入

 松哥精鼎统计 2020-10-23
导读

     当今数据大量增长促进信息科学蓬勃发展,文献是科学传播的主要媒介,一定程度上反映了科技增长规律。想了解特定领域发展历史、进程与趋势等规律,首先要建立相关文献数据库。本文以Web of Science数据库为例,以径流某相关领域为检索主题,详细讲解Web of Science文献检索和下载,文献数据导入R环境,建立文献计量分析数据库,以便后续分析。

文献检索与文献信息下载流程





1.进入WoS界面

图1 Web of Science 文献检索界面

图1中红色区域是主要操作区域。框1:选择数据库;框2:检索内容输入与设置;框3:检索时段设置;框4:子数据库等选择


2.数据库选择

图2 数据库选择

框1:下拉菜单,选择所需数据库,本文选择Web of Science核心合集(可以输出全纪录和参考文献)框2:所选数据库简介。

3.检索内容选择:主题,作者,机构等。
输入检索内容之前,我们先点击“检索提示”,查看检索规则(重要,建议仔细阅读),阅读完毕后返回检索界面。

图3 检索规则

4.返回检索界面:

图4 检索界面

一级检索方式有5中:基本检索、作者检索、被引参考文献检索、高级检索和化学结构检索。这里选择“基本检索”即可。
接下来,首先设置二级检索方式。下拉主题框菜单,框1显示检索方式内容,框2为所选检索方式的简介及示例。也可以点击“进一步了解”,详细了解所选检索方式的检索规则。如果需要增加检索条件,可点击“添加行”;如需要重新检索,可点击“重设”。本文中选择“主题”检索,检索条件:根据特定领域关键词进行检索(框3,本文未展示)。

5.检索时段选择

图5 检索时段选择

框1下拉可以选择根据需要选择检索时段。例如想了解近年来研究最新进展,可以选择“最近5年”;查找最新发表文章,可选择“最近2/4周”等;想了解本领文章发表历史及规律可选择“所有年份(1990-2020)”。本文根据研究需要,选择“自定义年限范围”,即跳转到框2,选择年限:1969-2019。

6.子数据数据库选择

图6 子数据库

框1显示了7中子数据库,本文选择SCIE和CPCI-S2个子数据库。根据条件精炼检索:文献类型,文献机构,文献时段等。

图7 检索结果1

图7 展示初步的检索结果。框1为根据条件获得的检索文献总数;框2为按不同指标查看检索文献列表;框3为检索文献结果列表;框4为进一步检索条件,即精炼检索。精炼检索包括高被引论文、开放获取、出版年、类别、机构、文献类型等18个指标,可根据研究需要对文献搜索结果进行精炼。本文对“文献类型”进行精炼。

图8 根据文献类型精炼搜索结果

点击框1“更多选项/分类…”进入右边界面,选择需要精炼的文献类型,本文选择前3项(框2),最后点击框3“精炼”。

6.检索结果下载

图9 检索结果

通过精炼检索,最后检索到392篇文献(框1)。可以点击框2中“检索历史”查看整个检索过程,确认无误后,准备导出检索结果。检索结果的导出方式有2种(框3),第一种是较为简便的“A 导出…”;第二种先“添加标记结果列表”,之后再导出(此方法能够了解更详细的导出细节)。我们先以第二种方法为例,向大家展示数据导出的过程。

图10 结果导出(添加列表方式)

首先点击框1,弹出对话框2,填写“记录来源”1-392,点击“添加”,最后结果显示为框3。然后点击“标记结果列表”,进入标记结果界面。

图11标记结果界面

首先在框1中选择“本列表中的所有记录”。第二步,框2中的内容“全选”。第三步,点击“A 导出…”,弹出对话框选择“其他文件格式”(框4),弹出对话框5,选择“纯文本”,点击导出,文献信息即成功导出。此种方法提供一个详细的导出细节和流程。

第一种方法非常简单,无需添加列表。先点击图9中框3“A 导出…”,弹出图11框4对话框,选择“其他文件格式”,弹出对话框(图12)。填写记录来源,选择“全记录与引用的参考文献”,文件格式为“纯文本”,最后点击导出,导出结果与第二种方法结果一致。

图12 导出结果至文件

    到此,数据导出完成,即完成了所需数据的下载,下载文件名默认为“savedrecs.txt”。

数据的导入





图13 R环境与数据导入、格式转换代码(框1)

1.加载包

library(bibliometrix)#加载包

2.#读取数据

D <- readFiles("E:\精鼎统计\savedrecs.txt ")

readFiles: 加载一系列ISI或者Scopus输出结果文件,格式为“large character”(大字符集)。

3.#数据转换成数据框格式

M <- convert2df(D, dbsource = 'wos', format = 'plaintext')

4. 运行结果:

Converting your wos collection into a bibliographic dataframe## Articles extracted 100# Articles extracted 200# Articles extracted 300# Articles extracted 392# Done!# Generating affiliation field tag AU_UN from C1: Done!

conver2df: 将WoS或其他数据库格式转化为数据框格式。

参数





file: 字符数组:WoS导出文件(plain text(纯文本)或bibtex格式 );Scopus导出文件(bibtex格式);pubmed类对象(RISmed)。

dbsource: 字符,表示数据来源,可以是“isi”, “wos”, “scopus”, “dimensions”, “pubmed”,默认是“isi”。
format:字符,表示文件格式,可以是“bibtex”,“plaintext”,“csv”,“excel”,默认是“plaintext”。

小结





本文以Web of Science数据库为例,详细讲解了文献检索和下载,数据导入R语言环境。下一次,我们将为大家介绍文献计量学中的主要指标和bibliometrix包中对主要指标的描述统计分析功能。

---文献计量学专题上期推荐---

 
文献计量学系列1:bibliometrix包简介

精鼎特邀

点亮再看,后续更加精彩哦!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多