信息检索第一步:如何分析主题选对检索词



“分析主题,选择检索词”
-暑期微课堂-
在知识的海洋中,每一次的信息检索都是我们探索未知的起点。随着学术相关文献信息化、电子化进程的不断深入发展,我们对相关信息检索的需求也越来越强,具备一定的信息检索知识与技能也成为我们日常学习、工作中的必备要求。那么,信息检索究竟是什么呢,其又如何在我们的学习生活中实际应用的呢?
本系列将推出四篇系列推文,分别从①分析主题,选择检索词、②选择数据库或检索工具、③确定检索途径和检索式、④观察结果与策略优化这四个部分进行介绍。
信息检索的含义
广义上来说就是“信息存储与检索(Information Storage and Retrieval)”,是指将信息按照一定的方式组织起来,并依据用户的需求找出相关信息的过程。其一般包含文本检索、数值/案例检索、音视频检索三类。
信息检索的流程

本期主题为:分析主题,选择检索词
检索词是表达信息需求和检索课题内容的基本单元,也是与数据库进行匹配运算的基本单元。检索词选择是否恰当会直接影响检索的查准率和查全率,因此检索词的选择要具有代表性、准确性和全面性。
如何确定检索词?可通过以下几个步骤实现:
(1) 分析检索主题,将主题拆分为若干个词或词组,用词或词组检索,不建议用整句进行检索。且要分析出课题所涉及的主要概念,理清这些概念之间的关系。一般选择研究对象、研究方法(技术)和研究目的作为主要概念,且注意选用专业术语,提高查准率。
(2) 从课题所属的专业角度做深入分析,进一步提炼出隐含概念,扩大检索范围,提高查全率。例如,课题“面向有机微污染物处理的高级氧化技术研究”,这里的“高级氧化技术”是课题的研究对象和研究方法,但如果直接使用“高级氧化”作为检索词,可能会漏检,应对其进一步提炼,常见的高级氧化技术有臭氧氧化、类芬顿氧化、电催化氧化等,这些都可以作为检索词,从而扩大检索范围。
(3) 检索词要考虑同义词、近义词、相关词等,外文检索词还要特别注意不同的缩写和拼法,以免漏检有关文献。针对不同拼法的检索词,可通过截词检索技术来避免漏检,即利用检索词的词干或不完整词形进行查找。
常用的截词符有“*”或“?”,例如:biolog*,可检出biological、biologist、biology、biologies等同根词。
不同的数据库表示的含义会有差异,可详见各数据库中的“帮助”。例如在Web of Science中,“*”表示任何字符组,包括空字符;“?”表示任何一个字符;“$”表示零或一个字符。
(4) 排除不适宜作为检索词的词汇,包括不具有检索意义的词汇和概念重复的词汇。例如,“研究”“分析”“方法”“问题”等都是无意义词。
(5) 通过使用工具可帮助我们选择专业术语,以及扩展检索词。常见的工具有:
中国知网“知识元检索”
https://www.cnki.net/

中国知网的“CNKI翻译助手”
http://dict.cnki.net/
百度百科
https://baike.baidu.com/
有道词典
http://dict.youdao.com/
生医学科
生物医药大词典
http://dict.bioon.com/
pubmed
http://www.ncbi.nlm.nih.gov/pubmed
中国生物医学文献数据库(CBM)中主题树(包含英文术语)
http://www.sinomed.ac.cn/index.jsp
参考书籍
叶春蕾,陈娜,林莉. 信息检索与知识利用. 北京:中国农业科学技术出版社, 2019:84-86.
祁延莉,赵丹群. 信息检索概论. 北京:北京大学出版社, 2013:1,133.