信息检索

用户信息需求与信息资源集合之间进行匹配的过程
信息检索(Information Retrieval,简称:IR),[1]在狭义上是指用户通过使用检索工具或系统,采用特定的检索策略和方法,从信息资源集合中查找和获取所需信息的过程。[2][3]广义上首先是信息的标引和存储过程,其次是信息的分析和检索过程。[2][3]信息检索的本质是用户信息需求与信息资源集合之间进行匹配的过程。用户在查找所需信息时表达需求,系统将需求特征与信息资源系统中的检索语言进行匹配。[2]
信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索成已为图书馆独立的工具和用户服务项目。随着1946年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来。[4][5]到了20世纪70年代,随着通信技术的发展,美国出现了Tymnet和Telnet等数据通信网络,通信费用有所降低,联机检索在美国逐渐普及。在20世纪80年代,随着微型计算机的广泛运用和高密度存储介质——光盘的出现,计算机信息检索进入了光盘检索阶段。在20世纪90年代,随着卫星通信技术、网络技术和多媒体技术的发展,信息检索进入了网络化检索阶段。[6][7]此外,随着人工智能技术的发展,因特网检索逐渐向语义和知识检索发展,进入智能化信息检索阶段。[8][9]
信息检索四大基本要素包括信息资源、信息需求、信息获取和信息利用,[10][11]在实践中经常使用的信息检索技术主要有布尔逻辑检索、截词检索、限定检索和位置检索等。[12][13]信息检索有多种分类,按检索手段可分为手工信息检索和数字信息检索;按检索对象可分为文献信息检索、数据信息检索和事实信息检索;按组织方式可分为全文检索、超文本检索和超媒体检索,[2][14]可通过以内容特征划分的主题途径和分类途径以及以外表特征划分的著者途径、题名途径、序号途径和引文途径进行信息检索。[6][15]
信息检索广泛应用在文档检索、[16]网页检索[17]和社交媒体分析[18]等领域,使人们能够用最少的时间和精力在文献中迅速而准确地获得所需的知识,[1][19]且能够培养人们获取最新信息和自我知识更新的能力,保持与社会发展同步的知识结构和思维方式,提高独立学习的能力。[20]但是信息检索同样面临着检索结果不全面、标引准确度不高、无法长久主动地提供信息服务等局限性。[21][22]

历史沿革