当前位置:首页 >> 表格类模板 >>

关于网络信息检索文献综述


关于信息检索文献综述
作者:蒋亚宾 摘要: 本文通过对信息检索的历史发展、 现状分析以及发展趋势做出总结与分析, 已达到对信息检 索的更深层次的认识,并希望在信息检索方面对读者有所帮助。 关键词:信息检索、历史发展、搜索引擎、发展趋势

1、前言 信息检索(information retrieval) 是指将信息按一定的方式组织和存储起来,并根据信息 用户的需要找出有关信息的过程。所以,它的全称又叫信息存储与检索(information storage and retrieval), 这是广义的信息检索。狭义的信息检索则仅指该过程的后一步,即从信息集 合中找出所需要信息的过程。相当于我们所说的信息查询(information search)。根据检索手 段的不同,分为手工检索、计算机检索(光盘检索、联机检索和网络检索) ;根据检索对象、 形式的不同,分为文献型信息检索、数据型信息检索、事实型信息检索。本文通过对以往关 于信息检索的文献进行综述,并从中总结出观点,达到对信息检索更深层次的认识。 2、历史发展 1950 年,莫尔斯(Calvin N.Mooers)首次提出信息检索(Information Retrieval)一词。 其后,随着信息检索理论和实践的更新发展,人们对信息检索的认识也在不断深入。主要存 在三种角度的认识: 时间性通讯、信息处理和文献查找。从时间性通讯角度来看,通过信 息检索得到了一些文献,从而使得著者与读者(信息检索的用户)之间建立起了一种通讯。 从信息处理角度, 信息检索的基本问题, 是如何处理信息和信息的结构。 从文献查找角度看, 信息检索就是查找出含有用户所需信息的文献的过程。 在信息检索领域, 这是一种传统的主 流观点。 从 19 世纪下半叶首先开始发展,至 20 世纪 40 年代,索引和检索已成为图书馆独立的 工具和用户服务项目。最初的信息检索系统面向小型的科学文摘数据库、法律和商业文档。 检索模型为基本的布尔模型和向量空间模型。 Cornell University 的 Prof. Salton 成为这个领域 的先驱,著名的 IR 向量空间模型的创始人,开发了著名的 SMART 向量空间模型 IR 系统, 并免费开放源代码,大大促进了 IR 的发展。80 年代,IR 技术出现在大型文档数据库中。90 年代,可以在互联网上利用 Archie 对 FTP 服务器上的文档进行搜索。Archie 是一个可搜索

第 1 页 共 5 页

的 FTP 文件名列表,用户必须输入精确的文件名搜索,然后 Archie 会告诉用户哪一个 FTP 地址可以下载该文件。1994 年 4 月,Stanford 两名博士生,美籍华人 JerryYang(杨致远) 和 DavidFilo 共同创办了 Yahoo。随着访问量和收录链接数的增长,Yahoo 目录开始支持简 单的数据库搜索。1995 年发布 AltaVista,它是网上最早的爬行搜索引擎。AltaVista 搜索技 术从纯文本搜索技术开始,到 1997 年,其搜索能力扩展到 25 种语言搜索;1999 年开始多 媒体文件的搜索;2001 年首次推出网上免费新闻搜索,2003 年 AltaVista 被 Overture 收购。 以雅虎初期为代表的第一代搜索引擎以人工目录分类为基础的网站搜索开辟了一个时代。 第 一代搜索引擎指主要依靠人工分拣的分类目录搜索,这种方式是被动的搜索,更新慢、搜索 能力不足。 3、现状分析 如今最主要的信息检索是网络信息检索。 网页是因特网的最主要的组成部份, 也是人们 获取网络信息的最主要的来源, 为了方便人们在大量繁杂的网页中找寻自己需要的信息, 这 类检索工具发展的最快。 一般认为, 基于网页的信息检索工具主要有网页搜索引擎和网络分 类目录两种。 网页搜索引擎是通过“网络蜘蛛”等网页自动搜寻软件搜索到网页, 然后自动 给网页上的某些或全部字符做上索引, 形成目标摘要格式文件以及网络可访问的数据库, 供 人们检索网络信息的检索工具。 网络目录则是和搜索引擎完全不同, 它不会将整个网络中每 个网站的所有页面都放进去, 而是由专业人员谨慎地选择网站的首页, 将其放入相应的类目 中。网络目录的信息量要比搜索引擎少得多,再加上不同的网络目录分类标准有些混乱,不 便人们使用,因此虽然它标引质量比较高,利用它的人还是要比利用搜索引擎的人少的多。 但是由于网络信息的复杂性和网络检索技术的限制,这类检索工具也有着明显的不足。 (1)随着网页数量的迅猛增加,人工无法对其进行有效的分类、索引和利用。网络用户面对 的是数量巨大的未组织信息, 简单的关键词搜索,返回的信息数量之大,让用户无法承受。 (2) 信息有用性评价困难。一些站点在网页中大量重复某些关键字,使得容易被某些著名的搜索 引擎选中,以期借此提高站点的地位,但事实上却可能没有提供任何对用户有价值的信息。 (3) 网络信息日新月异的变更,人们总是期望挑出最新的信息。 然而网络信息时刻变动,实时 搜索几乎不可能,就是刚刚浏览过的网页,也随时都有更新、过期、删除的可能。 随着网上信息资源的膨胀发展, 一种搜索引擎, 无论它多么完美都不可能满足一个人所 有的检索需求。如果遇到文献普查、专题查询、新闻调查与溯源、软件及 mp3 下载地址搜

第 2 页 共 5 页

索等情况,人们就更需要使用多种搜索引擎来比较、筛选和相互印证。为解决注意登陆各搜 索引擎,在各搜索引擎中分别多次输入同一检索请求(检索字串)等繁琐操作,于是基于网 络检索工具诞生了。目前这列检索工具只有两种:集成搜索引擎和元搜索引擎。所谓元搜索 引擎是在一个检索界面上链接若干种独立的搜索引擎,检索时,一次检索输入,可以指定搜 索引擎也可以要求多个引擎同时检索, 搜索结果由各搜索引擎分别以不同页面提交的网络检 索工具, 其实是利用网站链接技术形成的搜索引擎集合。 集成搜索引擎制作与维护技术简单, 可随时随所链接的搜索引擎进行增删调整和及时更新,尤其大规模专业(如 FLASH、MP3、 等)搜索引擎集成链接,深受特定用户群欢迎。例如国内天网搜索和百度搜索,国外比较著 名的有“搜索之家”“网际瑞士军刀” 、 、等。另一个是元搜索引擎,用户只需交一次检索请 求, 由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎, 并将所有查询结果 集中起来以整体统一的格式呈现在用户面前。国外 2010 年主流的元搜索引擎有 Google、 Yahoo、MSN Search、AOL Search、Netscape search、lwon。目前国内还没有见到真正意 义上的元搜索引擎。 4、发展趋势 4.1、智能化 智能化是网络信息检索未来主要的发展方向。 智能检索是基于自然语言的检索形式, 机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索。 用户所需要做的仅仅是告诉计算机想做什么, 至于怎样实现则无须人工干预, 这意味着用户 将彻底从繁琐的规则中解脱出来。近几年来,智能信息检索(intelligent information retrieval) 作为人工智能(AI)的一个独立研究分支得到了迅速发展。在 Internet 技术迅速普及的今天, 面向 Internet 的信息获取与精化技术已成为当代计算机科学与技术领域中迫切需要研究的课 题,将人工智能技术应用于这一领域是人工智能走向应用的一种新的契机与突破口。

4.2 可视化 可视化(visualization)的历史可以追溯到 2400 多年前。哲学家柏拉图指出,我们通过 看来识别物体。据统计,人获取信息有 70%一 80%靠视觉,20%靠听觉,10%靠触觉。用 图像(visual)取代文字帮助人们检索的优点在于:图像的表达方式生动、形象、准确、效率 更高,能从多角度揭示,而纯文字的表达方式是模糊、一维的。

第 3 页 共 5 页

4.3、简单化 未来家用电脑将朝着智能化、网络化、人性化和绿色环保的方向发展;操作系统的 用户友好性将不断增强, 如微软和苹果公司都在致力于操作系统网络化研究, 以便使其中的 任一应用程序都能“连接”进行“网络检索”,并与网络“交互”;各搜索引擎检索界面更加“傻 瓜化”。使用户学习和进行网络信息检索更加容易;网上自动标引、自动文摘、自动跟踪、 自动漫游、机器翻译、多媒体技术、动态链技术、数据挖掘和信息推拉等技术逐步发展、完 善, 会越来越方便用户及时准确地检索信息。 这些硬件与软件技术的发展都有利于网络信息 检索的简单化。

4.4、多样化 多样化首先表现在可以检索的信息形态多样化,如文本、声音、图像、动画。目前 网络信息检索的主体是文本信息, 基于内容的检索技术和语音识别技术的发展, 将使多媒体 信息的检索变得逐渐普遍。 多样化的第二个表现是检索工具向多国化、多语种化方向发展。网络的迅速发展,使得 整个世界变成了地球村, 世界各地上网人数的不断增多, 使得英语已无法满足所有用户的需 要,语言障碍越来越明显。 多样化的第三个表现是网上检索工具的服务多元化。网上检索工具已不仅仅是单纯 的检索工具,正在向其他服务范畴扩展,提供站点评论、天气预报、新闻报道、股票点评、 各种黄页(如电话号码)、航班和列车时刻表、地图等多种面向大众的信息服务、免费电子信 箱,以多种形式满足用户的需要。无论是在国际上还是在国内,检索工具都在朝多元化方向 发展,为用户提供全方位服务。 多样化还表现在网络信息检索可以间接地服务于其他行业。 例如数据挖掘技术可用于分 析历史数据的变化趋势,预测未来发展方向,发现大量数据中潜在的模式规律,为投资、科 研、项目评估等提供有力的依据;还可以系统地、定量地分析目前较为热门的研究发展领域 及查询频繁更新的文献资料种类, 可使信息中心、 图书馆等信息服务机构不断调整文献资料 及图书的订阅、收集工作,有的放矢,向以需求为驱动的方向发展,建立一套更为系统、科 学的管理方式。

4.5、个性化
第 4 页 共 5 页

个性化指各网站注重内容的特色化和注重个性化的服务。 网络资源的指数级膨胀,使得用户在获得自己需要的信息资源时要花费大量的时间 和精力。随着互联网的飞速发展,每个人的不同信息需求将凸现于标准化、单一的“大众需 求”之上,并成为各个搜朋够或网站努力追求的对象。不同的打有消费者个人烙印的产品将 成为某个消费者区别他人、 感觉自我存在及独特的外在标志, 个性化服务成功的实质在于提 供了真正适应用户需要的产品,贯彻了以用户为中心的理念。

4.6、商业化 网络检索系统拥有全世界数量众多的用户,吸引了大量的广告,为电子信息的增值 服务提供了广阔的空间。 网络检索系统已成为新的投资热点。 网络检索系统不再仅仅是一种 检索工具,而且成为一项产业,它的商业利益成为推动系统完善和扩展的主要动力,网络信 息的检索与利用由公用性转向商业化。美国著名的数字媒体评估公司 Jupiter Media Metrix 日前发布研究报告称,“搜索引擎公司推出的付费添加服务是一个正在兴起的、前景光明的因 特网领域,相对于目前低迷的在线广告市场来说,它的发展潜力是非常巨大的。” 5、总结 如何检索和利用信息资源,是一门学问,是现代人才的必备素质,也是一个人知识和能 力可持续发展的重要条件。教育部和国家教委早在 1984 年就要求各高校开设文献检索课, 并作为必修课,目的就是培养大学生的信息意识和获取文献信息的技能。近几年,随着计算 机和通信技术的发展,社会信息进程加快,信息、物质、能源成为人类社会的三大财富,谁 拥有信息谁就拥有财富,信息对于经济和社会的发展、科技文化的进步都起着重要的作用, 谁掌握了最新信息,谁就掌握了主动权。

参考文献: [1]王曰芬,丁晟春. 网络信息资源检索与利用[M].江苏:东南大学出版社,2009 [2]史红改,方芳. 实用网络文献信息资源检索与利用[M].北京:清华大学出版社,2009 [3]林海.信息检索发展浅析[J].科技情报开发与经济,2007,第 17 卷(10 期) :100—102 页 [4]肖燕. 20 世纪我国信息检索研究的历史回顾[J]. 图书馆学研究,1999,第 06 期 [5]丁明,祝博,李龙森. 网络信息检索发展趋势展望[J]. 科技资讯,2006,第 04 期

第 5 页 共 5 页


相关文章:
关于网络信息检索文献综述.doc
关于网络信息检索文献综述_表格类模板_表格/模板_实用文档。网络信息检索 文献综
网络信息检索文献综述写作_图文.ppt
网络信息检索文献综述写作 - 第五章 文献综述 写作 课件制作:张胜光 本章内容
信息检索文献综述.doc
信息检索文献综述 - 信息检索文献综述 前言:关于信息检索技术的文献综述,一、信
网络信息检索与文献综述-刘吉平._图文.doc
网络信息检索文献综述-刘吉平._幼儿读物_幼儿教育_教育专区。网络信息检索文献综述-刘吉平. 文档贡献者 三年五年158 贡献于2018-09-27 ...
关于信息检索技术的文献综述.doc
关于信息检索技术的文献综述 - 关于信息检索技术的文献综述 一、信息检索技术现状 【1】梁鸿雁,信息检索技术综述,2010(9),软件导刊,35~37,在现有研究的基 础上...
网络信息检索与文献综述-刘吉平_图文.ppt
网络信息检索文献综述-刘吉平 - 网络信息检索文献综述 刘吉平 2004-042004-04-27 科研与信息检索的关系 文献检索与科研相辅相成 文献检索是为科研服务的, ...
文献综述之信息检索技术.doc
文献综述信息检索技术 - 文献信息检索技术综述 【摘要】 介绍文献信息检索技术的发展过程,分析了网络文献信息检索的主 要技术方法,以及今后文献信 息...
浅谈信息检索在文献综述中的运用.doc
关键词:信息检索;文献综述;利用;撰写 1 前言 2l 世纪是知识经济和信息全球化的时代,计算机技术和网络技术迅猛发展,各 种信息充斥着大众的生活, 人们每天都被海量...
网络信息检索大作业.doc
网络信息检索大作业_教育学_高等教育_教育专区。《网络信息检索》大作业 1、 ...观点明确。一 般包括:文献综述、理论分析、观点论证、计算方法、实验原理和方法...
文献综述和信息检索.ppt
关于网络信息检索文献综... 5页 2下载券 《怎样写好文献综述... 67
文献综述和文献检索 可_图文.ppt
什么是文献综述 文献综述的样例和写法文献综述写作过程和格式 毕业论文的写作 科技文献检索方法初步网络信息检索第6章 张胜光制作 3 5 第一节 什么是文 献综述? ...
网络信息检索课件_图文.ppt
材的检索、浏览和下载的方法和技巧,使学生能够初步掌握在因特网上查找知识、文献的方法和 发布信息的技能,并能初步了解和掌握毕业设计文献综述和毕业论文的写作方法...
文献检索啊_图文.ppt
第五章 文献综述文献检索课件制作:张胜光 本章内容 1 3 2 3 什么是文献综述 文献综述的样例和写法文献综述写作过程和格式 4 怎样做毕业设计 网络信息检索第...
02 文献综述和文献检索_图文.ppt
第二章 文献综述文献检索 课件制作:张胜光 本章内容 1 3 2 3 什么是...网络信息检索第6章 张胜光制作 3 网络信息检索第6章 张胜光制作 4 网络信息...
网络信息检索课件_图文.ppt
材的检索、浏览和下载的方法和技巧,使学生能够初步掌握在因特网上查找知识、文献的方法和 发布信息的技能,并能初步了解和掌握毕业设计文献综述和毕业论文的写作方法...
cha5网络信息检索与利用综合实训_图文.ppt
网络信息检索综合实训与指导 5.1文献综述格式及写作技巧 5.2学位论文的文献检索 5.3信息检索与利用综合实训 5.4利用信息检索技术拓展课堂 5.5任务小结 5.6优秀...
开题报告与文献综述_图文.ppt
开题报告与文献综述 - 关于毕业设计(论文)文档撰写 的几个问题 文献综述 开题报告 论文(设计计算说明书) 外文翻译 网络信息检索第6章 张胜光制作 2 文献综述 ...
电子货币研究综述(网络信息检索课程作业).doc
网络信息检索课程作业,使用常用的数据库收集文献资料,撰写的比较简单的文献综述。隐藏>> 网络信息检索课程(论文) 电子货币研究综述 学专年姓 院业级名 103 座位号...
第1章 信息与信息资源_图文.ppt
8 《网络信息检索》教学计划章 次 教学内容 总学 时数 讲授 学时 实验 学时 教学 要求 1 2 3 4 5 6 7 8 9 第 1章 绪论第 2章 文献综述文献检索...
网络信息检索系列讲座_图文.ppt
网络信息检索系列讲座 - 学位论文开题前的文献调研 主要内容 ? 文献调研的检索步骤和方法 ? 数据库的选择 ? 检索词的确定 ? 检索结果的阅读分析与文献管理 ? ?...
更多相关文章: