维普资讯 http://www.cqvip.com ・信息服务・ 堕 堡堂 LsJ) 第32卷第3期(Vo1.32 No3) .网络信息资源开发利用的再认识 苏飞扬(宜春学院图书馆) 摘要就网络信息资源与传统信息资源的区别、网络信息资源的检索工具与检索蓑略、检索网络信息存 在的问题及对蓑等进行了探索。 ・ 关键词 网络信息开发搜索工具检索策略 因特网是目前世界上规模最大、用户最多、影响最大 的网络互联系统,它拥有极为丰富的信息资源,号称是世 界上最大的信息超级市场。但它不像传统图书馆里的信息 资源经过严格的选择和加工整序,而是一个缺乏管理与控 制的信息集合,难免存在假信息、假网站,甚至垃圾信息和 “交通阻塞”现象。如何及时准确地检索到所需信息?正是 本文要探讨的问题。 1 网络信息资源与传统信息资源的区别 作为涵盖传统的纸质文献、缩微文献、声像文献的数 字化形态以及网上信息资源的综合性信息集合,网络信息 资源与传统信息资源的区别主要表现在以下方面。 1.1栽体的多媒体化 传统印刷型信息资源只有一种单一的文本形式.缩微 制品和声像制品则分别实现了文字、声音和图像的电子 化,而网络信息资源则将多种媒体融合在一起,实现了信 息资源的多媒体化。呈现在人们眼前的不仅有静态的文 字、声音和图像,还有动态的文字、声音、图像,甚至是三者 的综合——多媒体知识信息。 1.2类型的多样化。 数字式的多媒体信息融入了高智能的现代信息技术, 是一种智能化的信息资源。它的类型丰富,形式多样,有联 机光盘、数据库、智能专家系统和动态Web网页等。 1.3存储的大容量化 传统印刷型信息源体积大,存储容量小,制作成本高。 而电子出版物则体积小,存储容量大,制作成本低,使用方 便,将来的纳米存储技术和量子存储技术则存储容量更 大,而互联网上网页数量,2oo1年l0月即已超过2O亿。 1.4内容的动态化 印刷型信息源生产周期长,大量信息在生产传递过程 即已陈旧,跟不上用户对信息的新、快、精、准的要求。而电 子信息资源,尤其是网络信息更新周期短,传递迅速,利用 及时,许多信息处于动态之中,即时生产,即时传递,即时 利用,能反映当今科技、政治、经济、体育、娱乐、文化等领 域的最新消息或发展动态。 1.5开发的智能化 信息资源是人类经验、知识和智慧的结晶,开发信息 就是开发智力资源。在当今信息化时代,图书馆地位的高 低与作用的大小,主要看它对智力资源的开发程度。过去 图书馆的参考咨询主要是对文献及其信息的检索和提供, 而今天则转移到信息的分析研究,形成咨询报告或研究报 告,为科学研究服务,为领导机关和其他用户决策提供依 据。由于信息资源开发深入到了文献的知识单元或信息单 元,提供的信息更准确、更实用。 2网络信息资源的检索工具与检索策略 传统的信息检索以手工检索为基础,以整本文献或整 篇文章为对象,方式单一。而在赛博空间,信息检索发展到 书目检索、数据检索、事实检索、专题检索、全文检索、超文 本检索、多媒体检索。从检索途径来看,网上数据库和其它 大量的电子信息资源大多能提供灵活多样的检索入口,如 全文数据库除了关键词、分类、作者、机构等传统入口外, 还能提供整刊、篇名、摘要、基金、蕴含、关联、全文、引文等 检索功能,用户使用起来十分方便。 2.1利用URL.直接访问 UfuL是各种计算机和文献资源在因特网上的地址。 UfuL的第一部分,即冒号前那部分,表示检索方法或想要 检索的资源的类型;紧跟着双斜杠“//”的部分特指机器的 名称或位置,通常是域名或机器的 地址。URL的一般格 式为:(通信协议):∥(主机 地址或域名)/路径/文件名。 如:http://www.techpub.corn。 注意搜集有用资源的URL十分重要,其获取途径既可 利用报纸、期刊以及专门介绍URL的手册,也可建立一个 自己的关于URL的计算机文件,保存一些有价值的站点的 URL,以便需要时查找。如《网络信息的检索与利用>一书 附录,收录了精选的常用网址五百多个。 2,2利用搜索工具 利用搜索工具检索因特网资源,是目前一种比较有效 的方法。对于需要进行主题检索的用户尤其如此。万维网 上现有一些功能很强的搜索工具,用户可以利用它们来检 索所需信息,系统一般会按照相关程度将找到的信息排出 次序。目前,搜索工具大致可分为以下三种类型: 2.2.1主题目录。这类搜索工具和传统图书馆中的主题目 录相似,它们提供一个等级型主题框架,每个主题下有相 维普资讯 http://www.cqvip.com ・信息服务・ 苏飞扬:网络信息资源开发利用的再认识 2OO2年第3期 关信息的站点列表。其特点是可以获取批量信息,利于族 性检索。主题目录类搜索工具中,最具代表性的是“雅虎 (Yahoo)”。键入“hap://www.yahoo.corn”地址,就会 有科技、艺术、就业、求学、商业、出版等主题框架, 每个主题下都有相关站点的列表和地址。 2.2.2搜索引擎。这是一种非常有效的搜索工具,用户 只要键入关键词或词组,系统就会立即提供一个符合需 要的站点的列表。搜索引擎的工作过程通常是这样的: 定期向它们能够辨认的每一个站点发送程序,将这些站 点的网页下载下来,然后查看这些文件并从中提取出可 用来描述文件的索引信息。AhaVista(http://www. ahavista.digita1.corn)可作为这类搜索引擎的代表。它包 括1.4亿个网页的信息,用户可以根据自己的需求,生成 多种检索策略,获得比较准确的检索结果。 2.2.3元搜索引擎。随着搜索引擎的数量不断增加,每 种工具的使用方法都各不相同,如何选择与使用搜索引 擎又成为因特网用户面临的一个新问题。在这种情况下, 搜索工具的设计者开发了元搜索引擎,使人们能够利用 多个搜索引擎进行网络信息检索。元搜索引擎的基本思 想是:当搜索引擎收到用户的检索提问时,同时查询其 他多个搜索引擎。元搜索引擎一般没有自己的数据库, 它借助统一的用户界面和筛选从不同搜索引擎获取的检 索结果,使提供给用户的检索结果的准确性和相关性更 高。例如:MetaCrawler(ht ://www.metacmwler.COllb/ index.htm1)可以同时把用户的检索提问送到OpenText、 Lycos,YahooE(及Gataxy3 ̄_些不同的搜索引擎中去 2.3利用已知站点的引导与连接 因特网上一些大型图书馆、学术机构的站点,除提 供本单位的信息外,通常还有大量的相关站点的引导和 连接.通过这种“举一反三”式的引导,用户可以获得 更丰富的信息。 3检索网络信息存在的问题及对策 面对网上丰富多彩的信息资源,每个用户都要注意 鉴别和取舍.从而达到事半功倍的效果,提高我们的检 索效率和工作效率。 3.1 网络信息资源的鏊别 一般地讲,对网络信息资源的鉴别可以从以下三方 面进行: 3.1.1 时效性。要考察网站的更新与维护情况,连接站 点的更新情况,是否连接已经过时的站点。许多站点都 会注明资料的更新时间,如果没有明确说明,便不能表 明资料是经常更新的。 3.1、2要考察登载在网站的资料是否经过加工,可信度 如何 在网络环境下, “人人都是出版商”,缺乏印刷型 书刊的严格审稿制度。如果发现网上信息存在拼写、打 印和语法错误,说明该资料未经加工,其真实性有待进 一步审查。 3.1.3可靠性。要考察网页的编写者,无论是个人还是 团体,都要设法了解其信用。特别是对于学术研究的站 点,考察其学术声望更为重要。还可以通过服务器的域 名来考察网站的可靠性。一般而言,知名专家、著名大 学、大型公司等的网页比较可靠。 . 3‘2检索网络信息资源时应注意的问题‘ 网络信息资源取之不尽、用之不竭。但如果不注意 节约带宽和避免不必要的数据或信息传送,就很难获取 相关信息,达到理想效果。 3.2.1避免洲际间的重复下载。用户必须学会使用因特 网分布式资源。用户在传递数据之前,应认识到可能造 成电子交通阻塞,特别是在连接局域网的带上。用户在 下载大量数据的文件时,应查询远程资源上的README 和FAQ文档,也许能找到同样信息的站点,而这些地点 离用户较近。因特网使用镜像服务器在低数据流量时间, 能复制信息资源,避免洲际问的多次重复下载。. 3.2.2避免传输大量的数据。与因特网联网的线路带宽 只有OIK,容易形成“车多路窄 的局面,因此应尽量 避免传输大量的数据,影响别人的使用。 3.2_3可以选择不装载图像。主页上的图像虽然很漂亮, 但它们在很大程度上延缓了网络的速度,如果将图像选 项关掉,就会以前所未有的速度穿行于因特网之中。 3.2.4在空闲时间访问因特网。很多时候,网络的缓慢 并不是MODEM速度问题,而在于许多人正在试图访问相 同的节点,或通过与你所在的同一管道出口到因特网上。 锗开因特网热点访问时间,选择流量较低时段访问因特 网,往往会给用户带来更大的效率。 随着多媒体技术的发展和广泛应用,大量的文献信息 以电子形式出现,尤其是光盘数据库剧增,这将更有利于 文献信息资源的开发利用。 参考文献 1 孙延蘅.网络信息资源的特点与分类.情报资料工作, 2002(2) 2岳红.因特网上的交通运输信息资源.情报科学,2002 (3) 3程红莉.搜索引擎对网络信息资源的文献控制方法研 究.情报科学,2002(3) 4穆安民.科技文献检索实用教程.重庆:重庆大学出版 社,1998 5黄如花.网络信息的艟索与利用.武汉:武汉大学出版 社,2002