分享

【Meta分析】什么是截词检索?截词检索怎么用?

 赵坤yb0sabwlt1 2020-12-24

系统评价/Meta分析指全面收集所有相关研究并逐个进行严格评价和分析,再用定性或定量合成的方法对资料进行处理得出综合结论的研究方法。在指导学员的过程中发现初学者在学习过程中常常会碰到许多共性问题,本公众号特此开设专栏解答,希望能够和大家共同学习交流Meta分析,共同成长,如有不当之处,还请大家批评指正。本期我们分享的是关于截词检索的那些事~

01

什么是截词检索?

经常会碰到学员在检索的时候一股脑儿的将所有的检索词OR起来,而不充分考虑词与词之间的联系。

例如Osteoarthritis, Osteoarthritides,Osteoarthrosis, Osteoarthroses,如果仔细看会发现这四个词都有一个共同的特点:以Osteoarthr开头。这个时候我们就可以使用截词检索,那么什么是截词检索呢?

截词检索是预防漏检提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。尤其在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。——摘自百度百科

在课程中我们讲到,常用的截词符号包括?, $和*,分别代表一个字符,0个或者1个字符和多个字符,而根据位置可以分为前截断、中阶段、后截断。

因此上面的示例我们可以用Osteoarthr*的代替进行检索,那么检索得到的会是什么样的结果呢?

通过检索PubMed数据库我们发现会得到更多的检索词检索结果,在这个检索结果中包含了我们想要的检索词,同样了也包含了很多无关的检索词。这既是截词检索的优先也是缺点,正如定义所说既可节省输入的字符数目,又可达到较高的查全率。提高查全率意味着查准率就会下降,无关文献的数目会变多,但是只要多出来的词不是文献的常用表达,那么得出的文献数量也会很少,因此总而言之只要检索得到的文献数量我们能够承受,那么检索策略就没有问题。

截词检索虽然很有用,但绝对不是滥用,截词的位置选择需要非常慎重,例如Osteoarthr*,如果截词的位置选择Osteoarth*,那么就会从68418篇文献变成68444篇,虽然增加的不多,但这一部分跟我们之前那四个词的关系已经不大了。所以在检索时,需要寻找自由词之间的逻辑关系,选择合理的截词位置。

那么在实际情况中如何选择自由词进行截词检索并构建检索策略呢?

我们在课程中为大家分享过寻找检索词的方法,今天我们主要为大家分享利用PubMed主题词与款目词来构建检索策略。

02

截词检索怎么用?

1. 单词词根截断法

这是最简单的一种方法,例如我们刚刚检索Osteoarthritis,其款目词如下图所示,那么我们可以用osteoarthr*这个词根检索到Osteoarthritides,Osteoarthrosis,Osteoarthroses,Osteoarthrosis Deformans,剩下的可以用词组"Degenerative Arthritis","Degenerative Arthritides"直接进行检索, 这样骨关节炎的检索组面就变成了Osteoarthritis[Mesh] OR

 Osteoarthr*[Title/Abstract] OR "Degenerative Arthritis"[Title/Abstract] OR "Degenerative Arthritides"[Title/Abstract]


2. 词组截词法(慎用)

在PubMed数据库检索中,采用截词检索时会自动关闭术语映射,什么意思呢?

我们以刚刚"Degenerative Arthritis"[Title/Abstract] O"Degenerative Arthritides"[Title/Abstract]为例,这两个词其实也有共同的特点,可以使用截词检索Degenerative Arthriti*来代替,可以看到非常符合预期,就是只有这两个词。也就是说PubMed数据库是支持词组进行截词检索的。

但是如果输入Degenerative Arthritis进行检索呢,我们看到如果不使用截词检索那么词组会进行自动映射,会检索degenerative和arthritis,同时还会进行主题词检索。这就是术语映射。

但为什么需要强调慎用呢?

我们在课程中讲到词组检索时需要添加引号,如果截词检索加上引号,会发现检索结果为0,这是因为引号表示限定检索,括号里是什么样就检索什么单词,而事实上不存在"Degenerative Arthriti*"这样的单词,所以结果是0。

这并不是说我们词组检索需要添加引号是错误的,这也是需要慎用的第二个原因,因为只有PubMed数据库是支持截词检索关闭术语映射的,在其他数据库中词组能否使用截词检索还有待探索(大家可以去实践),因此如果十分熟悉这样的用法,可以不加引号在PubMed中运用词组截词检索,而如果不熟悉的话,还是老老实实的按照我们说的,词组利用双引号进行限定检索,表明两个要同时出现。

3. 词组拆分组合法

如检索幼年特发性关节炎Juvenile idiopathic arthritis,主题词是Juvenile idiopathic arthritis ,款目词如下图所示

看到这个界面,需要观察这些词的共同特点:都有Juvenile这个词(Juvenile可以检索到Juvenile-Onset),但我们肯定不可能用Juvenile进行检索,这样范围太大,查准率非常低,因此我们还需要找其他共同的特点。Juvenile与Arthritis,StillDisease Still's Disease,Polyarthritis, Oligoarthritis这些词在一起出现,因此我们可以用词组拆分组合法进行检索

Juvenile AND (Arthritis OR StillDisease OR Still'Disease OR Polyarthritis OR Oligoarthritis).
当然还有不同的拆分方法,总的原则是先将词组分类,然后寻找类中的词组共同特点利用截词检索和AND进行组配,最后再将类用OR进行连接。本例中我们将所有词看成一个大类,共同的特点为Juvenile,然后再将其他词全部组合起来进行AND实现该组面的检索。

03

注意事项

我们在课程中虽然提到截词符有$和?,分为前截断、中截断、后截断,但是在实际运用过程中,可以看到

在PubMed数据库中并不支持,只支持*的后截断,因此在检索时要根据数据库的特点,因地制宜。原则是原则,并不适合每一个数据库,在检索时要保持警惕性。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多