推荐阅读:构建地方文献数据库的思考 构建地方文献数据库的思考 地方文献论文 更新:2006-4-8 阅读: 构建地方文献数据库的思考 [摘要] 说明建库的意义,从数据源、用户需求、人财物等方面分析建库的条件,从功能、规模、质量上提出建库的要求,重点探讨建库的方式、类
构建地方文献数据库的思考 构建地方文献数据库的思考 地方文献论文 更新:2006-4-8 阅读: 构建地方文献数据库的思考
[摘要] 说明建库的意义,从数据源、用户需求、人财物等方面分析建库的条件,从功能、规模、质量上提出建库的要求,重点探讨建库的方式、类型和步骤。
随着信息社会化发展,地方文献数据库需求迅速增长,图书馆应构建数据库,使地方文献资源得到充分开发利用。地方文献数据库是通过计算机实现对地方文献信息资源的收集整理、标引著录、检索输出的自动化检索系统。目前,大规模、标准化、开放型的地方文献数据库较少,滞后于其他文献数据库的建设,应引起图书情报界的重视和思考。
1 构建地方文献数据库的意义
建立地方文献数据库,开发地方文献资源有着十分重要的意义。①更为便捷、快速、准确地为教学科研提供文献及线索,促进科教事业的发展;②为地方领导决策和规划提供信息咨询,为地区建设提供信息资源,促进地区现代化发展;③为构建地方文献信息中心,实现资源共享打下良好基础:④体现图书馆的特色和发展优势,创造良好的社会效益和经济效益,促进图书馆事业的发展;⑤数据库产品走向市场,推动数据库产业化进程。
2 构建地方文献数据库的条件
2.1 数据源分析
①地方文献数量丰富。在地区发展的历史长河中,留下了丰富的地方文献资源。随着地区现代化建设的不断深入,地方文献信息量迅速增长,丰富的源源不断的文献信息给建库提供了必备条件。再则,图书馆难以做到无遗漏地采集收藏全部地方文献,建库恰好可以弥补缺藏并提供收集线索。②地方文献类型多样。按不同标准可将地方文献划分为不同类型,诸如:印刷型,视听型和网络型:图书、报刊和论文资料;公开出版物,内部交流资料和密级文献等等。地方文献多种类型并存,丰富了数据内容,尤其是重要的灰色文献。给地方文献数据库增添了特色。③地方文献分布广泛。分散于各学科文献中,分布于各种载体上,包含于其他文献内,分藏于众多单位里,出现于网上文献信息资源系统中。这种分散性,不便于地方文献的采集收藏和开发利用,将分散的地方文献通过建库得以集中,既弥补了馆藏不足,又方便了读者检索。
2.2用户分析
2.3人财物分析
在人才方面,大中型图书馆都拥有一批高质量的专业人才,具有信息服务的丰富经验,具有对信息的收集整理、分析加工的能力。在设备方面,计算机、多媒体、网络技术已在大中型图书馆普遍应用,计算机局域网、中国教育科研网(CERNET), INTERNET网已相继开通。在经费方面,经费虽然紧张,但可以多渠道多途径想办法解决,随着图书资料保障系统的逐步实施,争取得到资助;随着各级领导的重视,争取拨到专款;通过纵横联合,争取融合资金;通过数据库产品投放市场,争取回收资金。
综上所述,用户需求旺盛,建立地方文献数据库是十分必要的;数据源充足、有建库专业人员、拥有先进设备、多渠道筹集资金,建立地方文献数据库也是十分可行的。但是,数据库建设是一项投入大、技术强、周期长、见效慢的工作,建库会遇到各种各样的困难,需要通过多方面努力,解决困难和问题,创造良好的条件,使建库工作顺利开展。
3 构建地方文献数据库的要求
3.1功能要求
数据库建设的主要目的在于提供丰富的信息资源,实现资源共享,尤其是在网络环境下,必须要求拥有完善的,结构合理的检索功能体系。数据库系统软件的开发要注重实用性和通用性,要求用户界面友好,操作简便快捷、易维护、易推广普及。检索功能体系应具备查询检索,修改删除,新增补充三大功能,在网络环境下,考虑增设信息检索服务的辅助功能,如:网站到访功能、文献检索命中率统计功能、关键词或主题词检索频率统计功能等。查询检索功能要做到能对用户导引检索,提供多种不同的检索途径和检索点,不仅包括题名(书名),责任者,分类号,主题词、关键词等常规检索项,而且还要有年份,地名等检索点;既要实现各项相互间的“与”、“或”、“非”的逻辑组配检索,又要实现在一次检索结果的基础上实现多次循环检索,提高检索命中率。
3.2规模要求
从国内文献检索数据库的现状来看,我国数据库建设和发展趋势是大规模,全文型和网络化,表明对数据库规模要求越来越多。国内市场对文献检索数据库中信息记录的最低要求是5万条以上。因此,地方文献数据库建设也要适应时代的发展,要有一定的规模,数据资料不完备的小规模地方文献数据库,市场需求小,很难打开局面,容易变成死库。为此,应构建中等规模乃至大型的的地方文献数据库,能产生很好的社会效益和经济效益。
3.3质量要求
①数据源要准确可靠,数据源是数据库中每条数据的来源,也是数据质量的依据所在。因此,地方文献数据库的数据源不仅要有保障,而且要准确可靠。②标引著录要规范标准。地方文献数据库的信息检索的实现以其对地方文献信息的标引为基础,因此,对地方文献信息的标引必须统一标准和规范化,统一标准也是联网协作的前提,实现地方文献数据库与各种网上信息资源检索的接轨。③软件系统要通用实用。软件系统对数据的存取、修改、检索、联网等起着决定性的作用,要求地方文献数据库管理系统具有通用性和实用性,便于推广普及,利于多种地方文献数据库的数据交换。④检索系统要能网络化,地方文献数据库检索系统不仅能以光盘和软盘形式在单机上运行,而且要具备网络功能,通过计算机网络能在网上传输。
4 构建地方文献数据库的方法
4.1构建地方文献数据库的方式
根据不同的目的和任务,可采用不同的建库方式。①回溯过去的文献信息而建立地方文献数据库。目前已建成的地方文献数据库较少,而地方文献信息资源很丰富,为了充分发挥作用,回溯建立全面系统的地方文献数据库十分必要。②追新建库式。追寻新的地方文献信息连续建立最新地方文献数据库。将源源不断的无序的新文献信息及时有序地、连续性提供给用户检索利用。③独立建库式。由本单位独自建立地方文献数据库。一般在建立馆藏地方文献书目索引数据库时多采用此法。④联合建库式。纵横联合协作建立地方文献数据库。随着网络化的发展,从自发,独立、小型,分散的数据库生产走向协调,联合、大型、网络化是文献信息工作发展的必然趋势,必须摆脱孤军作战,改变各自为政的状况,应加快区域内图书馆、档案馆、博物馆等单位分工协作步伐,采用“统一规划、标准一致,分散加工,集中处理”的建库格局,联合构建综合性、全文型较大规模的地方文献数据库,达到共建共知共享。
4.2构建地方文献数据库的类型
地方文献数据库可按不同的标准划分不同的类型,①按数据学科内容分:综合型和专题型。前者是包括各学科内容的综合性地方文献数据库;后者是只收某学科或某专题内容的专题性地方文献数据库。②按数据加工程度分:书目索引型和全文型。前者是只提供文献线索和摘要的地方文献书目索引数据库,揭示文献深度浅,服务范围小;后者是既提供文献线索,又提供原文献内容的地方文献全文数据库,揭示文献内容深,满足用户的多层次检索需求。③按数据库产品形式分:机读型和网络型,前者是以检索光盘和检索软盘形式的地方文献光盘(软盘)数据库,可独立在单机上运行供用户检索使用;后者是设在网站上,建立网页的地方文献网络数据库,随时随地供多用户检索使用。
4.3构建地方文献数据库的步骤
4.3.1论证
建库前,必须从国内地方文献数据库开发、数据信息源、建库人员素质、技术设备、用户需求等方面开展可行性和技术论证。了解国内是否已有相同数据库开发,可通过各级组织协调,避免小范围小规模低水平的重复建设;调查地方文献信息源是否充足,前期准备情况如何:考察建库人员的知识结构和综合素质情况,是否能胜任建库工作;考虑硬件与软件环境,硬件配置是否符合建库要求,采用何种软件系统达到最优化;分析地方文献数据库产品的社会效益和经济效益,做好市场前景和用户需求的前瞻性分析。
4.3.2收集
建库论证后,接着收集地方文献信息,文献信息是数据的源泉,数据是数据库的核心,数据质量从某种意义上代表数据库的质量。因此,地方文献信息的收集是十分重要的环节。①制订科学的收集原则:公开出版的地方文献信息全面系统收集,灰色的地方文献信息尽全力收集,独立完整的地方文献信息重点收集,藏于其他资料中的地方文献信息选摘收集。②确定合理的收集范围:具体规定地方文献的类型范围。学科范围,时限范围和地域范围。③选择文献源收集。在馆内,收集馆藏地方文献信息;从计算机网络文献资源系统中,收集网上地方文献信息;到本地区,乃至全国各地的有关单位收集相关地方文献信息,④筛选审核文献,将收集的地方文献信息,进行整理、排序、查重、挑选、审核,最终确定哪些文献被收录数据库。
4.3.3标引
文献标引决定着数据质量,高质量的数据库必须做到科学规范化的文献标引。实现对文献信息规范化标引必须选好分类表和主题词表,前者实现对文献的学科内容标引——分类标引,后者实现对文献的主题内容标引——主题标引,分类标引多按《中图法》,必要时对有关类目进行适当的细分与扩充。主题标引一般采用《汉语主题词表》,从中选定恰当的主题词,分类组织数据。根据实际需要也可增加关键词标引,选定读者熟悉的关键词来标引,更接近读者的思维习惯,具有更强的实用性。总之,应根据实际情况,选择合适的标引方式,制订标引细则,具体规定标引的深度、分类的集中与分散,主题词和关键词的选用原则等,以便标引人员的共同遵照执行。
4.3.4著录
虽然著录是对文献外部特征的描述,但著录的完备与准确程度、文字录入的正确率等直接影响检索效果。因此,著录不仅要遵循GB3792-85文献著录总则、 GB3792.2-85普通图书著录规则、GB3792.3-85连续出版物著录规则等国家标准,而且要制订建库的具体著录实施条例和细则,使建库有关人员共同遵守以达到一致性的要求,力争达到著录项目统一,项目次序和单元次序统一等,保证数据质量。为了使数据具有可交换性,各类型文献均可采用标准化的机读目录格式——CNMARC、USMARC、LCMARC。
4.2.5审校
数据审校是保证数据质量的重要工作环节,为了减少标引错误,提高标引的一致性,应重视标引审校,要对文献标引的各项数据进行审核校对;为了减少数据著录录入错误。保证每一条记录的准确性,要全面,认真,细致地逐项核对,特别要注意对具有检索意义的项目的审校,及时发现错误并改正,把好数据工作中的最后一关。
参考文献
[1]孙继林. 国内文献检索数据库建设的发展趋势[J].图书馆杂志, 1999,(4)。
〔出处〕 图书馆论坛2001(4)