管理提醒: 本帖被 lou1984 从 文献检索知识 移动到本区(2010-04-20)
在文献信息检索过程中,要想得到令人满意的检索效果,关键是能够构造出全面描述、正确揭示信息需求的检索式。检索词是检索式的基本组成元素,如果选词不当就很容易造成漏检和误检,因此,能否选准、选全检索词直接影响到检索效果的优劣。那么,如何选定合适的检索词呢?
常用的方法是:从给定的课题名称出发,经过切分、删除、补充等步骤,确定检索词,最终通过组配,构成能全面、明确表达信息需求的检索式。
1、切分
对课题语句进行切分,以词为单位划分句子或词组。如:“改革开放三十年的得与失”,可以切分为:改革开放|三十年|的|得|与|失|。
2、删除
删除不具有检索意义的虚词、其他非关键词及过于宽泛和过于具体的限定词,只保留明确反映课题实质的核心词。不具备检索意义的词有介词、连词、助词等虚词如果应用在检索式中,会形成检索噪声,必须删除。过分宽泛的词,如:研究、探索、利用、影响、作用、发展等,没有触及问题的实质,而过分具体的词会造成挂一漏万,删除后会获得更高的查全率。
如上例中, “的”、“与”是不具检索意义的虚词,首先删除。“得”、“失”过于具体,如果用作检索词,就会漏检诸如“成就与失误”、“回顾与展望”等相关文献,因此也在删除之列。
3、补充
补充还原词组、同义词和近义词。很多时候,还要考虑上下位概念的扩展检索。
许多名词是由词组缩略而成,可以采用与之相反的操作——补充还原。如: “教改”可以还原为“教学改革”,“音质”还原为“声音质量”等。
最常用的补充检索词的方法是补充同义词和近义词。如上例中,增加“30年”作为检索词。再如,检索“互联网”方面的文献,要补充“Internet”、“因特网”两个检索词。
对于需要较高查全率的检索课题,可以以降低检索词的专指度为出发点,补充选用检索词的上位词。反之,对于需要较高查准率的检索课题,则要提高检索词的专指度,增加或换用下位词进行检索。如检索“香菇的栽培技术”的相关文献,应考虑香菇的上位概念:食用菌。在课题“轻金属的焊接”中,轻金属是一个上位概念,其下位概念包括:铝、镁等具体的金属,如考虑查全,应把轻金属、铝、镁等概念用逻辑或算符连接起来,作为一组词进行检索。
确定检索词后,分析各词之间的逻辑关系,运用布尔逻辑算符、截词符、位置算符等检索算符把各检索词组配起来,即可构成准确表达信息需求的检索式。
如上例中,检索式为:改革开放AND(三十年OR 30年)
需要说明的是:检索式的复杂与否,取决于课题需要。描述简炼的课题,检索式可能会很复杂;名称冗长的课题,检索式反而可能会很简单。
检索词是表达信息需求的基本元素,其选择恰当与否直接影响到检索效果。对于给定的检索课题,应首先深入分析课题内容,在提取核心词的基础上进行扩展,然后构造较为完善的检索策略和检索式,才能获得令人满意的计算机检索效果。