截词检索是防止漏检,提高查全率的一种检索技术,用于外文数据库。算符为*或?。其功能相当于布尔逻辑“”。

截词实际是截字母。在检索词的适当位置进行截断,防止漏检节省输入的字符。网络数据库主要用的是无限后截词

截词的方式与类型如下。

(1)自动截词

自动截词由数据库自动取词或截词。

(2)人工截词

人工截词按截词位置分为以下几种。

①前截词:*install(install、uninstall);

②中截词:sul*ate(sulfate、sulphate);

③后截词:treat*(treat、treated、treating、treatment)。

人工截词按截词数量分为以下几种。

①有限截词:book?? ( bookbooks ) acid?? (acidacidsacidic);

②无限截词:treat?(treat、treated、treating、treatment)。

后截词是一种满足前方一致的检索,用于名词的单、复数和动词词尾变化。例如,book*可检索出book和books两个词;treat*可检出treat、treated、treating、treatment这4个词。

其作用相当于布尔逻辑“或”。

关键词的提取对信息检索的影响(信息检索技术---截词检索)(1)

,