配色: 字号:
文献检索方法介绍
2013-10-15 | 阅:  转:  |  分享 
  
附一

科技文献检索

一、概述

科技文献检索(documentretrieval)是以文献(包括全文、文摘和题录)为检索对象的一种情报检索方式。在知识爆炸的今天,掌握科学有效的文献检索方法对大学本科生乃至研究生来说是至关重要的。塞缪尔·约翰逊(SamuelJohnson)说:知识分成两类,一类是我们要掌握的学科知识,另一类是要知道在哪儿可以找到有关知识的信息(Knowledgeisoftwokinds.Weknowasubjectourselves,orweknowwherewecanfindinformationuponit)。因此,对于大学生的培养,除了通过日常教学使其掌握基本的相关专业知识以外,更重要的是培养其主动获取知识的能力。作为教师不但能“授人以鱼”,而且还要能“授人以渔”。毕竟大学中课堂中教授的知识无论从时间上还是内容深度、范围上都是十分有限的。而生命科学是一门发展日新月异的学科,相关的知识领域更新快,单单依靠课本是很难满足学生培养目标和学生学习的需要。例如,仅从教材的更新速度上来看,国外课本的更新速度为版/2-3年,而国内的教材的更新速度则远远落后。因此,对于新知识的掌握和扩充,无论对于学生还是老师都是教学中一个重要的内容。科技文献检索的应用则为我们提供了一个获取知识的良好方法。

有人称我们的时代为信息时代一个前所未有的层次上不断产生、传递和利用信息情报的时代。内容性质和加工程度文献为四个级别零次文献一次文献二次文献三次文献???零次文献:未经出版发行的文献,包括手稿、个人通信、原始等。? 一次文献Primaryliterature):首次出版的各种文献,也称原始文献。如期刊论文、科技报告、会议论文、专利说明书等。一次文献是以科研生产活动的第一手成果为依据而创作的文献,内容丰富,参考价值大,是的主要对象。? 二次文献Secondaryliterature):图书情报工作者报道和查找一次文献的检索书刊,如各种目录、题录和文摘等。二次文献是图书情报工作者在大量收集原始文献的基础上,经过分析、归纳、重组后出版的。二次文献是一次文献的集约化、有序化的再次出版,是贮藏、利用一次文献的主要。

?三次文献(Tertiaryliterature):利用二次文献提供的线索,选用大量一次文献的内容,经综合、分析和评述再度出版的文献,各种述评、进展报告、动态综述、手册、年鉴和百科全书等。

???零次文献由于没有进入出版、发行和流通渠道,收集利用十分困难,一般不能作为我们利用的文献类型。而后三种文献是一个从分散的原始文献到系统化、密集化的过程。一般说,一次文献是基础,是检索利用的对象;二次文献是检索一次文献的工具,故又称之为检索工具;三次文献是一次文献内容的高度浓缩,利用的一种重要情报源…》系列。这些综述一般能系统的反映某一个专题的历史和现状,以及最新的研究进展和发展趋势,具有重要的指导意义。国内的综述多见于一些二级学报,主要由研究生撰写,相对来说着重于进展介绍,相比较而言指导意义较少,但可以作为了解进展特别是新技术、新进展和热点的重要途径。

科技文献的主要载体类型和出版类型

文献是记录知识的载体。记录的方法可以是文字、符号、图形和声像等多媒体信号等。载体的类型也是多种多样,从古代的甲骨、羊皮、青铜器到现在的纸张、磁盘和光盘等都可以作为文献的载体,了解文献的的载体类型以及出版类型及其特点,有助于我们选择合适的检索对象、方法和检索工具。现代文献依照载体形式、加工程度和出版类型可以分以下类型:

1.文献的载体类型

???1)印刷型PrintedForm):通过铅印、油印和胶印等手段,将知识固化在纸张上的一类文献。例如,图书、期刊以及各种印刷资料。这是一种有着悠久历史的传统文献形式,至今仍广为应用。它的主要优点是便于阅读和流传,缺点是体积大,信息密度低。???2)缩微型Microform):以印刷型文献为母本,采用光学摄影技术,把文献的影象固化在感光材料上的一类文献。常见的缩微型文献有缩微平片和缩微胶卷两种。这种文献的优点是体积小,信息密度高,缺点是必须借助阅读机或利用缩微复印机阅读。???3)声像型Audio-VisualForm):这是一种非文字形式的文献。常见的有各种视听资料,如唱片、录音带、电影胶片、激光声视盘、幻灯片等。类文献记录声音和图象,通过等予以重现,可以使人闻其声、观其形???4)机读型Machine-ReadableForm):近年来计算机的广泛应用而产生的一种新文献。常见的是有各种已录内容的磁带、光盘和磁盘。这种文献的存贮、阅读和查找利用计算机进行,有信息量大、查找迅速的优点近年多媒体(multimedium)的出现将声音、图象、文字、数据,通过计算机实现重放或检索,具有前几种文献载体的优点,发展特别迅速。设备昂贵、使用费用高缺点。.文献的类型

1)图书:论述或介绍某一领域知识的出版物图书又可分为类:一类是专著教科书、科普读物和一般生产技术图书,属阅读性的图书;一类是辞典、手册和百科全书等,属的图书

图书的著录特点是:有出版地、出版社名和出版年份有书名著者;非第一版的图书有版次;图书还国际标准书号(ISBN)。2)期刊:期刊一般是指名称固定定期或不定期连续出版物。期刊论文内容,报道速度快,信息含量大,据估计,期刊情报约占整个情报源的60-70%,(约占90%以上),因此期刊是传递科技情报、交流学术思想最基本的文献形式。在基础科学研究中,大部分的成果产出的形式是以发表期刊论文来实现的。因此,很多类型的其它文献如会议论文、学位论文等最终都会以期刊论文的形式进行发表。正因如此,受到科技工作者的高度重视。大多数检索工具也以期刊论文作为报道的主要对象。对某一问题需要深入了解,较普遍的办法是查阅期刊论文。emailedTableofContents),即读者可以订阅最新的出版内容标题和摘要,通过email发送给读者,方便读者获取最新的出版内容。

期刊论文著录的特点是:有作者有篇名期刊名称常常缩写有卷号期号。3)会议文献:是指在国际或国内重要的学术或专业性会议上发表的论文。会议文献学术性,往往代表着某一领域内的最新成就,反映了国内外科技发展水平和趋势,是获得最新情报的一个重要来源。会议文献可分为会前文献,如会议日程预报和会议论文预印本会后文献,如各种会议录。会后文献是会议文献主要的会议文献著录的特点是:有表示会议的专门用词,如Conference,Symposium,Convention,Workshop,Meeting,Congress,Assembly等有表示会议录的一些词,如Proceedingsof...,Collectionof...会议召开的地点、届次、时间,以及会议录的出版社、出版地、出版时间等。

4)科技报告Sci-TechReport):科技报告是指国家政府部门或科研生产单位关于某项研究成果的报告,或是研究过程中阶段进展报告的出版特点是各篇单独成册,统一编号,由机构连续出版。在内容方面,报告期刊论文科技报告可分成技术报告(Technicalreports)、技术备忘录(Technicalmemorandums)、札记(Notes)、通报(Bulletins)类型。(TopSecretReport)、机密报告(SecretReport)、秘密报告(ConfidentialReport)、非密报告(UnclassifiedReport)、解密报告(DeclassifiedReport)等。科技报告的质量因多种因素影响而参差不齐,但从总体上看,一般涉及的都是最新研究课题和尖端技术,因而能充分反映一个国家的科学技术成果、动向和发展水平。

科技报告著录的特点是:有表示报告的词,如Report,Memorandum等报告号。?????5)专利文献:专利说明书是指专利申请人向专利局递交的有关发明目的、构成和效果的技术文件。它经专利局审核后,。专利说明书的内容比较,有的还有附图,通过它可以了解该项专利的主要技术内容。专利说明书对于,是一种切合实际、启迪思维的重要情报源。专利说明书著录的特点是:通常有表示专利的词(Patent)有专利号专利号按国际规定由两个字母表示的国家名称和其后的顺序号构成。

6)标准文献:指。作为一种规章性文献,它具有一定的法律约束力。一个国家的标准文献反映着该国的生产工艺水平和技术经济政策,而国际现行标准则代表了当前世界水平。国际标准和工业先进国家的标准常是科研生产活动的重要依据和情报来源。标准文献著录的特点是:通常有表示标准的词如standard,recommendation等;有标准号。每个标准一个号按惯例由标准颁布机构代码,顺序号和颁布年份三部分构成7)学位论文Dissertation):学术论文学位论文的质量参差不齐,学位论文是非卖品,以科技报告、期刊论文的形式发表外,一般不出版,属难得文献。

学位论文著录的特点是:有表示学位论文的词,如Thesis,Dissertation等;有学校。????8)产品技术资料ProductDocument):指产品目录、产品样本产品说明书商品宣传和使用资料。产品样本通常对定型产品的性能、构造、用途、等作具体说明,内容成熟,数据可靠,有的有外观照片和结构图。

产品技术资料著录的特点是:通常有表示产品样本一类资料的词,如Catalog,Guidebook,Databookof等;有公司名称。

9)档案ScientificRecord):指科研生产活动中形成的,有的技术文件、图纸、图表、照片和原始记录等。详细内容包括任务书、协议书、技术指标、审批文件、研究计划、方案大纲、技术措施、调查材料、设计资料、试验和工艺记录等。是科研产工作中用以积累经验、吸取教训的重要文献。

技术档案一般为内部使用,不公开出版发行,有些有密级限制,因此在参考文献和检索工具中极少引用。

???10)政府出版物GovernmentPublication):指各国政府部门及其设立的专门机构发表的文献。政府出版物的内容十分广泛,既有科学技术方面的,也有社会经济方面的。就文献的性质而言,政府出版物可分为行政性文件(如国会记录、政府法令、方针政策、规章制度以及调查统计资料等)和科学技术文献我国政府发表的科学技术白皮书就是一种科技类政府出版物。

lectronicLiterature):上述的各种文献的出版类型大多是基于传统的纸质印刷。近年来,随着计算机和互联网的普及,电子文献大量的涌现,由于它在文献储存和检索上存在的天然的优势,所以其发展异常的迅猛,包括上述多种类型在内的各类文献很多都以电子文献的形式出现。电子技术在信息的存贮、传播和应用方面已经从根本上打破了长期以来由纸质载体存贮和传播信息的一统天下,代表了信息事业发展的方向。除了兼收并蓄传统的文献外,电子文献由于其本身的海量存储和自动检索功能,在科技文献检索特别是在生命科学中有传统文献无法比拟的优势。前面提到,我们所处的时代是一个信息时代。同样,我们现在所处的还是一个生命科学高速发展的时代。而信息科学和生命科学的结合则是二者共同发展和进步所需要的。以人类基因组计划为标志,产生了大量的生物数据文献,没有电子信息技术的发展,储存和利用这些海量信息是无法想象的。同时由于大量生物文献的产生,使我们在科学研究的同时,越来越依赖文献的检索和事实的发现。

电子文献主要包括各种类型的数据库以及散布在互联网上的各种文献信息。其特点是信息更新快,每时每刻大量的信息都在实时更新。覆盖范围广,从空间上来说覆盖全球的信息资源。从内容上来说,信息全面、类型多样,包括各种文本、图像、声音、视频等。在检索方式上,网络采用人工智能、专家系统、超文本、友好界面等让用户访问网上的各种信息资源。因此,无论在服务内容、方式、深度、广度、效果和效益等方面,网络信息资源几乎胜过了以往所有传统的信息资源,成为人们查找信息的首选目标。通过数据库和互联网,各种形式的电子文献不仅是以一整篇文献为单元存储在系统中,而且可以通过特定关系的相互之间的链接,将不同的电子文献关联起来。这样,用户从任一信息点出发可以浏览与其相关的各个信息单元,大大提高了检索的效率。

上述各种文献类型在出版时间上是有先后的。如果某作者完成了一篇手稿,最快的形式除了学位论文以外,会议、报告和专利是最理想的选择。但这三种形式都要求论文满足一定的特殊要求,而期刊则没有这些要求,且品种多,容量大,速度也很快,从而成为多数论文的发表渠道。目录、题录和文摘,略后于专利、报告、会议和期刊,取原始文献的主要内容作客观报道。而综述、图书和百科全书则需取大量原始文献的精华,或作评论,或汇编成册,所需时间更长。至此,从出版形式上说的文献周期就大致完成了。这种文献周期又称之为文献链。

.现代文献的

随着科技的不断进步,科技文献也不断的积累发展,其发展趋势表现为以下几个方面。首先是文献数量的增长,科学技术发展的总趋势是不断向前发展的,从事科学研究的人员日益壮大,而相应的科技文献的数量也成指数级上升。例如,美国的《生物学文摘》(BA)在其创刊的第一年中收录的生物学文献为14506篇,而在1985年一年中则收录了22万篇生物学文献,这个数字到1997年一年中收录的文献上升到380万篇。这种文献的大量产生也对科研人员对文献的利用提出了新的要求。

随着文献的数量激增,现代文献的另一个特征是存储密度和效率不断提高,从过去的印刷型到现在的电子文献,一个小小的计算机硬盘就能储存上万本书籍,同时新的技术如蓝光DVD光盘的可以在一张光盘上存储18G的数据,而一些新的存储技术还正在研究中,此外由于计算机的发展,使过去手工的检索被计算机检索所替代并且越来越具有智能化,从而使海量情报的检索成为可能。

现代文献发展的第三个特征就是文献的分布成离散状态。所谓的离散状态是指,虽然科技文献大量的发展,但重要的期刊所包含的科技文献的信息量远远的高于那些相对不重要的期刊。这一规律是由英国图书馆学家布拉得福提出来的,也称为布拉得福定律。例如据统计,1988年SCI数据库中共收录了4400种期刊,其中的900种(21%)拥有同年引文的83%(800万)。文献的这种离散式分布对于文献检索来说有着重要得意义。它告诉我们,尽管现在科技文献数量激增,而且出版的方式类型多样,而我们只要掌握本学科相关的重要核心期刊,就能做到掌握本学科的核心文献。例如我们国内的核心期刊,就是各专业中比较重要的期刊,在文献的信息量上占很大的比重。而国外的著名的科学引文索引(ScienceCitationIndex,SCI)数据库,正是通过引用关系,而将一篇文献和其它文献关联起来,从而评价期刊的重要性,其收录的刊物一般都是某学科中重要的期刊,相对来说这些期刊的文献信息含量要远远的大于其它期刊。

现代文献发展的第四个特征是文献的使用寿命不断的变短,这也是科学技术不断飞速发展的结果。科技的发展必然带来文献数量的增加,而数量的增加又直接反映在单位时间内所产生的文献速度增加,从而导致文献的使用寿命不断的缩短。例如前面提到的教材,现在教材的更新速度远远高于从前,是因为知识的产生和积累在变快。这也给科技工作者和大学教师提出了严峻的要求,只有不断的通过掌握最新文献,才能不断的更新自己的知识结构,才能满足科学研究和教书育人的需要。

通过对现代文献发展的趋势,我们可以看到文献的飞速发展是其根本的特征,也是科技发展的必然性。这种发展即有其有利的一面,同时也有其不利的一面。大量科技文献的积累固然是一笔宝贵的财富,而这种财富并不是简单的积累就能变成财富,对于科技文献来说其作用除了储存记录外,更重要的是利用这些科技文献,从而产生出新的成果。科技文献数量的激增,会造成科技文献的出版率与科技人员对其兴趣和利用之间的不平衡,导致研究精力的巨大浪费。同时,由于大量文献的重复,或者同样的文献以不同的形式出现,这些都造成了科学研究的浪费和文献检索上的不便。因此,从应用角度来说,对于科技文献最重要的是怎样去利用,而科技文献的检索是利用文献的第一步。

三、常用的科技文献的检索方法

科技文献检索的原理

文献的检索和文献的存储是两个不可分割的过程。文献的检索是文献存储的逆过程,只有文献按照一定的特征和规律进行存储之后,才能按照相应的特征检索出来。因此,文献的存储是文献检索的前提。文献存储的过程是按照文献的内容特征和外部特征进行浓缩,并按照上述特征进行分类编排,用特定的标准化检索语言形成文献标引的过程。文献的内容特征是指文献所阐述的主题内容,文献的外部特征是指文献的作者、题目、期刊、发表日期、页码、专利号等文献外表识别特征。文献的检索过程则是根据上述文献的外部特征和内容特征将相应的文献从文献库中搜索出来。一般来说,文献的检索过程可以分为两个步骤:第一是对要检索的内容进行分析,如果有待检索文献的外部特征如作者、题目、发表期刊等信息则可以直接利用上述文献外部特征通过检索工具进行检索。如果是通过文献内容特征进行检索,要首先形成检索的主题概念,并对主题概念按照文献标准化检索语言进行标引。第二步是将上述标引的主题概念或外部特征形成的检索提问标识通过具体的检索工具,在文献数据库中进行比对,当检索提问标识和文献特征标识相一致时,该文献即被检出。文献存储和检索的原理如图1所示。需要注意的是,文献检索的最终结果还要进一步进行核实,只有那些真正与待查课题相关的文献才是真正需要的检出文献,因此有效的检索方法是尽可能多的检出相关文献,而过滤掉不相关的文献。

除了以科技文献为检索对象的检索外,我们在科研学习过程中还可能遇到另外的两种检索类型即数据检索(DataRetrieval)检索(FactRetrieval)事实检索即通过对存贮的文献中已有的基本事实,或对数据进行处理后得出新的事实过程。例如

???

图1:以文献内容特征进行检索的原理图

检索效率

检索效率表示检索系统在进行情报检索时的有效程度,即指检索系统所具备的查全能力和查准能力。衡量检索效率有两个主要指标,即查全率(RecallRatio)和查准率(PricisionRatio),分别用字母R和P表示。

3.确定检索途径

检索途径的选择取决于两个方面,一是待查课题的检索要求和已知信息,二是使用的检索工具所具备的检索途径有那些。一般来说常用的检索途径主要可以依据文献的内容特征和外部特征分为主题途径、著者途径、分类途径、题名途径和序号途径等。

主题途径在文献检索中应用最为广泛,一般用于全面了解某一主题的文献,或者在没有更多的其它信息下使用。主题途径具有直观、专指、方便等特点。主题途径表征概念较为准确、灵活,不论主题多么专深都能直接表达和查找,并能满足多主题课题和交叉边缘学科检索的需要利用这一途径检索文献,首先要明确课题的学科属性、分类等级,获得相应的分类号,然后逐类查找。按分类途径检索文献便于从学科体系的角度获得较系统的文献线索,即具有族性检索功能。它要求检索者对所用的分类体系有一定的了解熟悉分类语言的特点熟悉学科分类的方法交叉边缘学科。(也有称为跟踪法)就是利用文献后所附的参考文献、相关书目、推荐文章和引文注释查找相关文献的方法。从已有的文献后所列的参考文献着手,逐一追查原文,再从这些原文后所附的参考文献逐一,获得一批相关文献的方法。它是科研人员常喜欢用的一种简便的获得文献的途径。其优点是:,此法可较快地获得一批相关文献。…》系列,和《CurrentOpinionin…》系列都是生命科学方面比较著名的期刊,特别是《CurrentOpinionin…》系列,在每篇综述参考文献中,作者还对引用文献的重要程度进行了分类,分为普通文献,重要文献和很重要文献,并在参考文献中,对后两种文献除有常规文献的作者、题目、出版期刊、时间、页码等外部特征记录外,还有比较简短的内容介绍,对读者有很大的帮助。

引文法又可分为两种,较为普遍的查法是由近及远地追溯,这样由一变十,由十变百地获取更多相关文献,直到满足检索要求为止。这种方法适合于在掌握最新的研究进展情况下,对以前的研究历史或相关研究方法进行查询。一种是由远及近地搜寻,即找到一篇有价值的论文后进一步查找该论文被哪些其它文献引用过,以便了解后人对该论文的评论、是否有人对此作过进一步研究、实践结果如何、最新的进展怎样等等。由远及近地追寻,越查资料越新,研究也就越深入。现在网上的很多期刊和数据库都提供引文服务,可以方便的检索到相关文献的引文和被引用情况。同时有些数据库还提供文献被引用的提示服务,这是基于email的一种服务,类似于eTOC。当用户对一篇重要文献感兴趣时,可以定制如果该文献被其它文献引用,则会有email及时通知用户,从而使用户方便的追踪该文献的引用情况,并通过该文献的引用来追踪最新的进展。

2)常规法:引文法虽然简单易行,但也有其缺点。通过引文法不可能列出有关专题的全部文献,因而这种方法的漏检和误检的可能性较高,也称工具法由于检索工具书刊的种类繁多,一般应根据课题内容特点首先利用综合性的检索工具,然后使用专业性的检索工具,二者结合,才不致造成主要资料的漏检。常用法根据时间范围又分为顺查法、倒查法和抽查法。查找前要确定该课题研究的历史背景,从研究开始的年代查起,一年年或一卷卷地通过检索工具查找。这种方法比较费时,且问题发生的起始时间不容易一下子确定,但。,倒查法比较省时省力,但有可能漏查一些有用的文献。

抽查法根据课题研究的特点,抓住该课题研究发展迅速,出版文献较多的年代,抽取一段时间(几年或十几年)或一段时间内的几个点,再进行顺时查找的检索方法。使用抽查法,检索时间较少,查得文献较多,但有漏检文献的可能,并要求检索者对课题研究的历史情况有较多的了解和掌握。3)循环法

也称,。具体地说,采用这种方法查找文献时,既要利用一般检索工具,又要利用文献后附的参考文献进行追溯,分期分段地交替使用,获得满意的相关文献为止。实际课题的检索选用哪一种方法,要根据具体情况而定。一是根据课题研究的需要,二是视所能利用的检索工具和检索手段。在检索工具比较的条件下,可以利用常法针对性很强文献的条件下可利用追溯法获得相关性较强的文献获悉研究课题出版文献较多的年代即可利用抽查法。

6.原始文献的获取

1)原始文献信息的获得:要正确地找出获取原文所必需的著者姓名、题名、出版时间及详尽的出处,首先应该弄清楚各种检索刊物的著录格式。例如,在很多文献检索工具中,文献发表的期刊名为缩写形式,要将其刊名缩写还原成刊名全称。一般检索刊物都附有引用出版物一览表,供查对收录的出版物全称之用。或查阅专门的刊名缩写检索工具,如《期刊刊名缩写》(PeriodicalTitleAbbreviation)。对于非拉丁语系文字出版的拉丁译名还原为原名,如中文、日文期刊的刊名在英文文摘中一律采用拉丁文著录,故在翻译时应首先将缩写刊名还原为全称,然后再转换为原语种。很多同学在国外检索工具中查阅到的文献是国内发表的中文期刊,由于不会还原,为找到原文耽误了很多时间和精力,也许这些期刊就在本地的资料室或图书馆很容易查到。原始文献的信息还包括要通过文献著录特征识别文献的类型以及文献的作者和所在机构信息。

2)获取原文的途径:①订阅本专业重要的相关期刊,这是获取文献最简便的方法,对于本学科重要的期刊由于利用价值高,所以在条件允许的情况下订阅是获取相关文献的最简单的方法。也可以通过本单位图书情报部门或图书馆查询,是否有订阅相关文献的期刊。这种方法虽然简单,但毕竟不能涵盖所有的文献,同时订阅的成本也比较高。②通过国内的主要图书情报机构进行定点复印或者通过馆际协作获取原文,这种方式获取原文比较有保证,但相对所需时间较长,而且复印成本和馆际互借的成本也较高。现在国内一些主要的图书情报机构可以通过电子扫描形成电子版文件进行馆际文献互传,从而提高了文献传递的效率。③从著者获取原文。给国外的论文著者写信索取论文单行本(reprint)或复印件已是国际上通行的学术交流方式。据统计,全世界每年向著者索取抽印本达数百万件。特别是现在绝大多数的科技文献发表后都有电子版的,更加方便了原文的索取和传递。而且通过email进行原文的索取和传递在邮寄成本、邮寄时间及其稳定性上也较传统方式有明显优势。但对发表时间较长的文献一般很难得到电子文献。除了文献以外,对于一些公开发表的实验材料也可以进行索取。一般情况下作者对有人索取文献态度很积极,有时还会将相关的文献和材料主动寄给索取文献者,这也是科学交流的好机会。利用上述方法索取文献,一个主要的问题是著者的地址或者email的获取,对于比较新的文献一般索取的成功性较大,而发表时间较久的要注意作者的地址变动。特别是第一作者,在国外一般是研究生或者博士后,流动性较强,最好与责任作者联系。同时还可以根据著者姓名、研究机构和地址信息进行著者新的联系方式的查询。④通过互联网进行下载。很多的期刊都有其相对应的电子出版物,可以从互联网上进行下载。但相对来说完全免费的电子期刊比较少,一些期刊只在部分时期或者一定时间以前出版的期刊提供免费的下载服务,大部分的期刊需要注册和收费。⑤从检索刊物出版机构获取原文或者利用国际联机检索终端向国外订购原文。国外一些著名检索机构如美国化学文摘社(CAS)、情报科学研究所(ISI)等都可向用户提供原文。这是一种较快的订购方式,而且可以稳定的获得所需文献,但缺点是费用昂贵。

四、科技文献检索应用

前面介绍了有关科技文献检索的一些基本概念和科技文献检索的基本策略。这一部分我们主要从应用的角度介绍一些常用的检索方法和工具。和以前相比,现在文献检索可利用的方法和途径大大的增多,从而检索的方法也随之多种多样,这里主要具体介绍和生物学相关的文献检索的途径和方法。

中文科技文献的检索

1.中国生物学文摘

《中国生物学文摘》(ChineseBiologicalAbstracts)(月刊ISSN:1001-1900)创刊于1987年,由中国科学院文献情报中心、中国科学院上海生命科学研究院和中国科学院生物文献情报网主办,中国科学院上海生命科学研究院出版。《中国生物学文摘》是国家科委批准的国家一级检索期刊。每年报道的文献约在一万篇左右。从生物各学科收录的内容上包括普通生物学、细胞学、遗传学、生理学、生物化学、生物物理学、分子生物学生态学、古生物学、病毒学、微生物学、免疫学、植物学、动物学、昆虫学、人类学、生物工程、药理学以及生物学交叉学科与相关科学技术领域。从收录的文献范围上包括国内(含港、台地区)公开出版发行的有关生物学方面的期刊、论文、专著、会议录以及我国科技人员(含港、台学者)在国外出版物发表的论文均有收录。选题力求结合我国科研、生产、教学的实际,并酌情选收能开阔生物专业研究人员思路的带启迪性的有关科技文献。

该刊采用《中国图书资料分类法》分类,每卷第一期附有引用期刊一览表。检索的途径包括著者索引、分类索引和主题索引,其中第一卷是著者和分类索引,从第二卷开始分类索引被主题索引取代,有利于用户直接通过主题词进行内容相关文献查找。

《中国生物学文献数据库》光盘是《中国生物学文摘》的机读产品,它包括了《中国生物学文摘》自创刊以来的全部数据,每年更新一次,年更新量一万条以上。同时在网上提供检索服务(http://www.cba.ac.cn/)。该数据库收录800余种源期刊全面覆盖生物科学、基础医学、基础农学、基础药学与生物交叉学科等,尤其注重全面体现现代生物科学的新进展,并全面收录国内生物科学研究机构在国外所发表的研究成果,包括期刊文献与会议论文文献。文献覆盖年限长,目前已收录1985年以来的文献信息,在此基础上对于收录期刊还在逐步回溯其创刊年,最早已经追溯到1950年,累积约20万条数据。收录的文献种类丰富,数据库文献以期刊文献(包括研究论文、综述或述评、简报)为主,同时也包含一定比例的专利、硕/博士学位论文以及重要学术会议论文等文献。文献内容包含中文与英文两种语言。该数据库具备强大的检索功能,提供6种检索途径(主题、作者、单位、出版物、分类、文摘和标题中的全文检索功能等),并且从汉字、英/拼音的途径均能检索,同时又以丰富的字段逻辑组合满足专家级的准确检索需求。对于分类号、作者、主题词、关键词、期刊等均具备无限链接功能。目前网络版数据库的更新速度是两周更新一次,光盘版每季度更新。

2.《中国期刊全文数据库(CJFD)》

《中国期刊全文数据库(CJFD)》www.cnki.net)下的科技文献数据库服务。中国知网是中国知识基础设施工程之一,由清华大学中国学术期刊(光盘版)电子杂志社研制,于1999年6月开通运行。目前,共正式出版了22个数据库型电子期刊。使CNKI数字图书馆所囊括的资源总量达到全国同类资源总量的80%以上。收录1979年至今约7200种期刊全文。至2005年4月止,累积全文文献1370多万篇。九大专辑:理工A、理工B、理工C、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学、电子技术与信息科学126个专题文献数据库。国内公开出版的6100种核心期刊与专业特色期刊的全文1994年至今,6100种全文期刊的数据完整性达到98%。CNKI中心网站及数据库交换服务中心每日更新,各镜像站点通过互联网或卫星传送数据可实现每日更新,专辑光盘每月更新(文史哲专辑为双月更新),专题光盘年度更新。CNKI的知识网络服务系统(KNS)是CNKI系列数据库产品的运营支撑平台,它通过智能化、交互式手段,将各种孤立、异构的信息资源集成整合为相互关联的知识网络,形成统一、开放的资源体系,对外提供增值性知识传播服务。KNS系统是网络化、智能化权威信息检索系统,让用户以更自然的方式,精确、高效地获取所需信息是KNS系统最基本的设计目标。不仅可以进行单库检索、跨库检索。读者还可以按不同的检索方式进行初级检索、高级检索、专业检索。有种数据库提供给用户,其中包括“中国学术期刊全文数据库”、“中国优秀博硕士学位论文全文数据库”、“中国重要报纸全文数据库”、“中国重要会议论文集全文数据库”等世界一流的数据资源。所有这些数据库都为读者提供了方便的全文下载。日志分析提供了详尽的日志信息,由年到月到日,记录下登录、检索、导航、下载等各项明细。初级检索分类检索,通过导航逐步缩小范围,最后检索出某一知识单元中的文章。检索项:检索项是动态显示的,检索项中下拉列表的名称是从所选数据库的检索点中汇集的共性检索点,选择不同数量的数据库,下拉列表中所显示的检索项名称有可能不同;检索项名称在下拉列表中显示。?a.题名、关键词,摘要,参考文献,指其中之一包含输入检索词的记录。b.作者、第一作者,默认是作者,如果选择第一作者,就只在第一作者字段中检索。c.来源,在来源中检索。d.作者单位、基金,指可在作者单位和基金之一中检索。e.全文,指在全文中检索。??f.智能检索,即字段检索,是系统根据文章所在刊是否核心刊以及统计出的文章下载次数及被引用次数得出的文章相关性与重要性排序,进行相似检索。排序:无:按文献入库时间顺序输出。相关度:按词频、位置的相关程度从高到低顺序输出。匹配:精确:检索结果中含有与检索词完全匹配的词语。模糊:检索结果包含检索词或检索词中的词素。排重:不排重:检索结果直接列表输出。题名排重:对检索结果中的题名进行去重后输出。检索辅助控制词频控制、检索扩展控制?词频控制以检索词在某一检索项中出现的次数控制检索的精确度。?检索扩展控制用户输入检索词后可以通过“扩展”功能从数据库词典中选择相关词进行扩展检索,以增加用户对陌生词汇的有效检索结果并且”、“或者”、“不包含三种逻辑关系的优先级相同,即按先后顺序进行组合。两个检索词间的关系,可选择“+”(或者)、“”(不包含)、“”(并且)逻辑运算以及同句、同段等关系。专业检索单一检索项多条件检索可指定多个检索词或检索表达式,使用“+”(或者)、“-”(不包含)、“”(并且)三种逻辑运算进行组合。可以单独或组合使用中的运算符构造表达式,使用前请详细阅读其说明。多个检索项同时检索多个检索项的检索表达式可使用“AND”、“OR”、“NOT”逻辑运算符进行组合。这三种逻辑运算符的优先级相同。如果要改变组合的顺序,可以使用圆括号“()”将条件括起来。所有符号和英文字母包括操作符,都必须是英文字符。题名、关键词、摘要、主题、作者、机构、第一作者、全文、来源、参考文献、基金。

用户可以选择排序方式包括相关度其中无是按文献入库时间顺序输出。相关度是系统根据用户给出的检索词按词频、位置的相关程度从高到低顺序输出。允许用户控制检索结果输出数量,对每屏显示的数据条数,提供五种数量输出:10、20、30、40、50。顶部有命中记录数信息,上下翻页功能按钮,转页按钮(),还有“全选”,“清除”,“存盘”按钮选中相应的文章,可以通过“存盘”按钮来保存记录的题名,作者,来源,摘要,关键词等信息,输出字段可定制。检索到文章后,在检索结果的细览区不仅有文章的所有相关信息,还可以使您在感兴趣的领域进行扩展,八种扩展链接方式参考文献、被引文献、同类文献、读者推荐文章、相关研究机构、相关文献作者、相关关键词、中图法分类文献??参考文献:根据参考文献中的文献类型链接到相应的资源数据库。?被引文献:将引用这篇文章的文献列出供读者查阅。同类文献:可以链接到本库中的同类文献全文供读者查阅。?读者推荐文章:根据文章的访问量将相关文献列出供读者查阅。相关研究机构:链接到知识网络中心,可以在配入知识网络中心的数据库中进行机构检索。相关文献作者:链接到知识网络中心,可以在配入知识网络中心的数据库中进行作者检索。相关关键词:链接到知识网络中心,可以在配入知识网络中心的数据库中进行关键词检索。中图法分类文献导航:可以让读者以中图分类法进行导航检索。点击作者、机构或关键词这些检索的结果,出现一数据库集合知识元数据库知识元数据是由海量的概念词典组成,当在知识元数据库检索时,会返回词的概念定义,在这个词的定义正文中,对许多相关的知识点概念进行链接,这样一级一级地形成一个庞大的知识网络体系。它可以帮助我们在没有工具书的情况下,很快地理解阅读学习一些生疏的文章。CajViewer进行阅读,浏览器可以从网站上免费下载现在的版本为6.0,该浏览器功能丰富,具有图书管理功能,支持单页\连续页浏览模式、知识元链接、自动滚动,文字编辑功能可将选择的内容发送到指定的Word文档,页面定位更加方便,支持书签、注释、高亮、直线,曲线、下划线,删除线和自定义知识元等八种标注功能,并有专门的标注窗口对它们进行管理,可对标注信息进行编辑,方便的书架管理让更易于管理书籍,更加强大的搜索功能让更加容易查找到感兴趣的文本,并且能迅速定位到文档的相关位置

《中文科技期刊数据库》是由重庆维普咨询有限公司开发的大型中文科技期刊数据库,源于重庆维普资讯有限公司1989年创建的《中文科技期刊篇名数据库》,其全文和题录文摘版一一对应包含了1989年至今的8000余种期刊刊载的万篇文献,并以每年150万篇的速度递增。覆盖范围涵盖自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等学科的8000余种中文期刊数据资源。按照《中国图书馆分类法》进行分类,所有文献被分为8个专辑:社会科学、自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报。8大专辑又细分为36个专题”、“+”、“—”为其运算符。无论是单项检索还是复合检索均可采用后截断参与检索和逻辑运算。该数据库由专业质检人员对题录文摘数据进行质检(包括标引和录入错误),确保原始文本数据的质量。在主题标引用词基础上,编制了同义词库、同名作者库并定期修订,有助于提高文献检全率。学位论文类数据库政策法规类数据库科技成果类数据库专利技术类数据库论文统计类数据库机构与名人类数据库数字化期刊类数据库工具类数据库”、“+”、“^”为其运算符。万方数据资源系统还支持二次检索,即在检索结果的基础上进行二次检索。检索的结果也具有关联检索功能,即从检索结果中的相关跨库信息可无缝连接,方便用户对感兴趣的信息在不同数据库中检索。上述检索功能也可进入“检索中心”完成检索,并且检索中心可以提供用户的检索历史,方便用户对已有的检索条件进行新的检索。

结果输出可以按照题名、收录时间、词频和数据库等进行排序,排序的方式可以按照升序和降序排列。当结果的条目超过500的时候,排序功能就无效了。

英文科技文献的检索

1.美国生物学文摘(BiologicalAbstracts)

美国《生物学文摘》1926年创刊,其前身为美国细菌学会主办的《细菌学文摘》和植物学会主办的《植物学文摘》。1964年10月BA编辑部正式命名为“生物科学情报服务社”(BIOSIS:BiosciencesInformationService)。目前BA每年出版2卷,每卷12期,是半月刊。65年开始出版“生物研究题录”,现更名《生物学文摘/报告、评论、会议》(BiologicalAbstracts/Reports、Reviews、Meeting,简称BA/RRM),同样为半月刊。

BA是目前世界上较权威的报道有关生命科学文献的文摘刊物,它收录世界90多个国家和地区,20多种文字的6000余种期刊和1200个文档题录中的文献,以及少量的专题论文、学位论文、科技报告和专著等。年报道量约35万条,其重点在生命体鉴别、内部过程与环境的作用及其应用等方面。BA学科覆盖面除包括传统的动物学、植物学和微生物领域外,还包括生物医学工程及仪器等一些边缘学科和相关领域。

BA的特点是:创刊历史长,收录范围广。文摘质量高,由专家或作者本人写,质量较高。文献报道速度快,源期刊出版3-5个月后,就能收录到BA中。文摘收录质量高,有专业人员负责,文摘部分有参见,可扩大检索范围。

BA分文摘和辅助索引两部分组成。文摘部分的页码均以AB开头,著者索引部分均以AI开头,生物分类索引部分均以BI开头,属类索引部分以GI开头,主题索引部分以SI开头。

BA的检索途径分为:①著者途径,已知著者时可用该途径。著者索引是按文献资料的作者姓名字顺排列的一种索引。通过它可查出已知个人或团体作者的文章。本索引只列出作者名称(包括个人和团体)和文摘号。一篇文章有几个作者就有几条索引(最多不超过十个),可相互参见。除每期末附有作者索引外,还出版有年和半年累积索引。②生物分类途径,该索引按BIOSIS(美国生物科学情报社)生物等级分类体系编排。检索时,先确定课题所涉及的生物体属于哪个界、门、纲、目、科,通过生物分类表找出其在序列中的位置。在生物分类索引中查到该类,然后在该类目下找到相关的主要概念和文摘号。根据文摘号查的位置,选择所需要的文献。③主题途径,该索引以文章论述的主要内容作为关键词(Keyterms),并以关键词作为检索标目词,并按关键词的字顺排列,以数字开头的关键词置于最后。首先确定要查的关键词及同义词,按关键词字母上下在主题索引中查找标目词,根据上下文所提供的信息进行取舍,最后通过文摘号查找文摘。④分类途径,用BA最前面的“文摘主要概念标题表”,在课题内容所属主要概念标题和次要概念标题下,直接浏览文摘,从中查的切题的文摘。

BA中所有期刊杂志名称均为缩写形式,为了便于读者查找原文,BA每年出一本“BIOSI引用期刊目录(SerialSourcesfortheBIOSISDataBase)”,可查全称。

BIOSIS(www.biosis.org)的产品有印刷型、光盘型、网络型和联机型,其电子数据库(BIOSISPreview)包括BA和BA/RRM,是世界上最大的生命科学的文摘和索引数据库。该数据库收录5500种有关生物学、化学和医学期刊的原始文献,包括传统的生物学、植物学、生态学和动物学,交叉学科(生物化学、生物医学、生物工艺学等)以及一些相关领域(使用仪器和方法等)。其在线服务器每周更新。每年的新增文献报道量约56万篇,从1969年至2003年共收录了约1400万篇文献,主要包括学术论文、会议论文、书评和专利文献。

BA光盘版(BiologicalAbstractsonCompactDisc,简称BAonCD)的内容等同于印刷版BA,由美国生物科学信息服务中心(BIOSIS)自1980年起编辑出版,每3个月更新一次,每半年的数据制成一张光盘。

2.Elsevier公司ScienceDirectOnSite(SDOS)数据库

ElsevierScience是一家设在荷兰的历史悠久的跨国科学出版公司,是ReedElsevier集团中的科学部门,全球最大的科学文献出版发行商

近年来,该公司收购了许多出版公司,包括美国的Ei公司,同时该公司将其出版的1,800多种期刊全部数字化,建立了ScienceDirect全文数据库,并通过网络提供服务。该数据库涵盖了数学、物理、化学、天文学、医学、生命科学、商业及经济管理、计算机科学、工程技术、能源科学、环境科学、材料科学、社会科学等众多学科,共计超过450万篇学术全文。清华大学与荷兰ElsevierScience公司合作在清华图书馆设立镜像服务器,通过网络提供95年以来Elsevier公司1739种电子期刊全文数据库即ScienceDirectOnSite(SDOS)的服务,目前共收录全文260余万篇。全国工程文献信息中心以集团方式组织国内11所学术图书馆于2000年1月正式订购了ElsevierSDOS数据库。目前,全国有近百所高校和中科院全部院所加入SDOS中国集团,中国高校每月下载量高达250万篇。目前该数据库中和生命科学相关的期刊约有300余种。

在SDOS数据库,用户可以通过检索和浏览两条途径获取论文。http://elsevier.lib.tsinghua.edu.cn/)和上海交通大学(http://elsevier.lib.sjtu.edu.cn/)国内用户可以直接通过镜像网站下载文献。该数据库认证机制主要通过IP地址进行认证,加入SDOS中国集团的高校和研究所,可以直接登录进行文献的检索和浏览。

1)浏览方式:从数据库入口登录后,会看到系统提供按字顺(AlphabeticalListofJournals)和按分类(CategoryListofJournals)排列的期刊目录,分别组成期刊索引页或期刊浏览页界面。用户可在期刊索引页中选择浏览的途径(字顺或分类),在期刊浏览页中选择自己所需的刊名。单击刊名,进入该刊所有卷期的列表,逐期浏览。单击目次页页面右侧的期刊封面图标,可连接到ElsevierScience出版公司网站上该期刊的主页。在期刊索引页或期刊浏览页上方设有一个检索区,可进行快速检索。

用户可在左侧检索框中输入检索词,再利用右侧下拉菜单选择检索字段。检索包括:“AllFields(所有字段)"、“Citation&Abstract(题录和文摘)”、“AuthorName(作者)”、“ArticleTitle(文章标题)”、“Abstract(文摘)”等。在期刊浏览页上方的检索区中,还可利用另一下拉菜单选择“AllofElectronicJournals(所有电子期刊)”、“JustThisCategory(学科分类)”或“JustThisJournal(期刊)”检索字段,进行期刊种类的限定。检索策略确定后,点击“Search”按钮,进行检索。

检索单击页面“SimpleSearch”按钮,进入简单检索界面。简单检索界面分为上下两个区,即区和。检索可在输入区中选择“Field(所有字段)"、“Articletitle(文章标题)”、“bstract(文摘)”、“AuthorName(作者)”、“JournalTitle(期刊名)”“PII(PublishedItemIdentifier,出版物识别码)”等字段,SubmitQuery(呈交查询)按钮开始检索Reset(重設)按钮来清除检索框内的内容。系统默认各检索字段间为“AND(与)”的关系。

论文类型(articletype)的限定中,“Article”表示只显示论文;“Contents”表示只显示期刊题名;“Miscellaneous”表示只显示其他题材的论文。

检索式构成布尔逻辑算符:AND、OR、NOT:在同一检索字段中,可以用来确定检索词之间的关系。系统默认各检索词之间的逻辑算符为“AND”。截词符:,表示检索同输入词起始部分一致的词。如micro可以检索到microscope、microcomputer等位置算符:ADJ表示两词之间位置邻近但前后顺序固定NEAR或NEAR(n),表示两词间可插入少于或等于n个单词,且前后顺序任意,如果不使用(N),系统默认值为10拼写词:TYPO[]:可进行同一词义不同拼写的检索。词组检索:用“”括住要检索的词组、句子

3)结果输出:检索结果有两类信息。一类是期刊题名,在题名下有该刊目次页(tableofcontents)的超链接和搜寻相关文件按钮;另一类是期刊论文题录,排在靠后的部分,显示论文标题、出处、作者、相关性排序分(“Score”)和搜寻相关文件按钮,通过搜寻相关文件按钮可检索到与该文内容类似的文章。

单击期刊题名下的“tableofcontents”按钮,可浏览目次信息;单击论文题录下的“Abstract”,按钮,可浏览该文章的标题、作者、作者单位、关键词、文摘等进一步信息;单击“ArticleFullTextPDF”按钮,即可看到论文全文(PDF格式)。"SaveChecked"按钮,即可生成一个新的题录列表。从浏览器的“文件”菜单,选择“另存为”,可按.txt格式或.html格式保存题录。在结果中点击相应文献的作者等字段可以在数据库中进行关联检索。在论文的文摘页下方,有一个“GetCitationExport”按钮,输出的数据主要供图书馆员参考。

SpringerLink是国际著名科技出版集团Springer的网络版全文文献服务系统。通过SpringerLink可提供全文服务的文献包括Springer出版的500余种科技、医学等学术期刊,大部分的期刊可回溯到1996年。20余种世界知名科技丛书和权威的Landolt-Bornstein数值与事实型工具书共2000多卷。

SpringerLink的网络版全文文献划分为11个学科,并由此构成了SpringerLink的11个电子图书馆系列。目前SpringerLink提供全文服务的电子期刊按11个学科划分如下:ChemicalSciences(化学)36种;ComputerScience(计算机科学)52种;Economics(经济学)32种;Engineering(工程)60种;Environmental(环境科学)38种;Geoscience(地球科学)49种;Law(法律)6种;LifeScience(生命科学)115种;Mathematics(数学)90种;Medicine(医学)185种;PhysicsandAstronomy(物理与天文学)51种。这些期刊大部分被著名二次文献服务收录并在SCI中有很高的影响因子。

SpringerLink通过纯数字模式的专家评审编辑程序,从以卷期为单位的传统印刷出版标准过渡到以单篇文章为单位的网络出版标准,现在已有超过200种期刊优先以电子方式出版(OnlineFirst),大大提高了文献网上出版的速度和效率,并保持了文献的高质量要求。Springer的发展目标是把OnlineFirst出版方式应用到所有SpringerLink提供全文服务的期刊上。SpringerLink新的服务系统增加了与重要的二次文献检索数据库的链接,如已经与EI建立了从二次文献直接到SpringerLink全文的链接,并且正在与ISI引文实现链接。

SpringerLink新的服务系统还增加了用户友好的个性化服务功能:"我的最爱"(MyFavorites)可让用户设定个人浏览习惯,节省时间、方便、实用;"Alert(速报)服务"可让用户进行注册并设定个人研究领域,当有与之相关的最新文献出版时即可根据用户选择以电子邮件或在用户使用数据库时通知用户。

SpringerLink通过清华镜像站(http://springerlink.lib.tsinghua.edu.cn)或德国站点(http://springerlink.com)提供服务,数据同步更新。任何用户均可登录SpringerLink的国内外站点浏览和检索文献的卷期、文章题录和文摘。阅读全文需以团体用户订购Springer的产品和服务,获得通过IP控制的使用权。

SpringerLink采用IP地址控制,在任意一台联网计算机上,不需用户名和密码即可登录SpringerLink的清华镜像站或德国站点。此时,读者身份为团体用户,可以对包括Springer网络版丛书在内的SpringerLink所有电子出版物进行浏览、检索和查阅文章标题和文摘。对于SpringerLink提供的一些个性化服务,例如上面所提到的MyFavorite和Alert服务,读者须在SpringerLink德国站点主页注册为个人用户并以个人用户登录后方可使用。

在SpringerLink数据库,用户可以通过检索和浏览两条途径获取论文。ArticlesbyCitation)、文章检索(ArticlesbyText)和出版物(Publication)检索。检索方式可选“Allwords”,表示两词全部检索,词序及位置不定,词间的关系相当逻辑“AND”。“Anywords”表示两词分别检索,其结果是两词的集合。词间关系相当逻辑“OR”关系。“Exactphrase”表示严格按照两词输入状态进行精确检索。“Booleamsearch”表示检索词可用逻辑算符匹配。

也可以点击"AdvancedSearch"通过高级检索查阅所需文献全文,在高级检索模式下,可以选定检索词之间的关系、选定检索的时间范围、选定检索的期刊范围。同时可以选择检索出的文献的排序方式,可以按时间和相关度进行排序,以及每页的文献条目数。在期刊浏览的页面右边也可以通过"QuickSearch"在对应的期刊卷期内进行检索。快速检索是基于页面中出现的出版物全字段检索。检索词可以是一个词或一组词。在词尾后坠以“”表示系统做词根检索。词尾后坠以“”,则表示该词的所有时态变化词都在检索范围内。将符号“?”放置在词中间,表示模糊检索。

检索的结果以列表的方式给出,可按时间或相关程度排序。全文有html和PDF两种格式,PDF文件可以通过AcrobatReader保存在本地。Html文件中文献有直接的连接,可以直接链接到参考文献,在参考文献列表中提供有效的参考文献、文摘、引文、全文链接,例如可以通过交叉引文(CrossRef)链接到参考文献的全文。在检索结果中还支持二次检索。

4.PubMed数据库(http://www.ncbi.nlm.nih.gov/PubMed/)

PubMed文献系统是由美国国立卫生研究院(NIH)下属的美国国立生物技术信息中心(NCBI)开发的数据库网上检索系统。它的文献主要来源于MEDLINE数据库。MEDLINE是美国国立医学图书馆(NLM))最重要的生物文摘数据库,内容涉及医学、护理学、牙科学、兽医学、卫生保健和基础医学。收录了全世界70多个国家和地区的4600余种生物医学期刊,现有书目文摘条目1200万余条,时间可回溯1966年。除了以MEDLINE数据库为主要引文来源,PubMed还收录其它非MEDLINE数据库,如Out-of-Scope引文数据库和PubMedCentral引文数据。Out-of-Scope引文数据库收录的文献最初主要是来源于与生命科学相关的综合性科学期刊和化学期刊,其中的文献也可能被MEDLINE收录。PubMedCentral是和生命科学及医学相关的全文数据库,该数据库是也是NCBI开发的一个数据库,提供完全免费的全文查询,由于收录的源期刊的免费全文提供策略不同,其收录的免费全文有些会比印刷板晚几周到一年不等。除此上述数据库之外,PubMed文献系统还和其它一些数据库合作提供相关引文的检索,如:HealthSTAR,AIDSLINE,HISTLINE,SPACELINE,BIOETHICSLINE,和POPLINE等。

1)检索

登录PubMed即进入NCBIEntrez检索系统,此时默认的检索库为PubMed(图3)。在页面上端的提问框中键入英文单词或短语(大写或小写均可)后回车或点击“Go”,PubMed即使用其词汇自动转换功能进行检索,并将检索结果直接显示在主页下方。检索词的输入如果检索结果不符合要求,用户可以在提问框中增加或删除词语。PubMed支持布尔逻辑式和针对不同途径检索,高级用户可以直接通过表达式在检索词窗口中输入相应表达式进行检索。对于初级用户可以利用检索窗口下端的Preview/Index和Details状态下来修改检索式,也可使用“Limits”(参见Limits的用法)选择限定条件后再进行检索。此外,用户可根据需要使用通配符“”或双引号进行截词检索或强制检索。



图3:PubMed检索界面

检索途径主要有主题途径、著者途径和期刊途径。著者途径格式为:著者姓空格名字首字母缩写,输入后系统会自动到著者字段去检索,并显示检索结果。也可以在著者姓名前后使用双引号,并用著者字段标识——[au]加以限定,则系统只检索著者字段。在提问框中键入刊名全称或MEDLINE形式的简称和ISSN号,然后回车或点击Go,系统将在刊名字段检索,并显示检索结果。如果刊名为单词或与MeSH词表中的词相同,需要用刊名字段标识——[ta]加以限定,否则系统将在全部字段中检索。使用刊名全称或MEDLINE简称可检索到数据库中的全部相关记录。使用ISSN号进行检索,则不能保证检到数据库中较早的记录。

PubMed检索系统具有词汇自动转换功能(AutomaticTermMapping),在检索词窗口输入的检索词将自动被相应的单词表转化然后再进行检索。输入的检索词首先在MeSH转换表(MeSHTranslationTable)中进行检索如果查不到再在刊名转换表(JournalTanslationTable)中进行查询,如果还没有匹配的词则通过著者索引(AuthorIndex)。该功能可以提高对用户输入的检索词的检索质量,尤其当用户输入不规范的词时。当用户不需要词汇自动转化功能时,可以通过强制检索功能来进行检索。PubMed允许使用双引号(“”)来强制系统进行短语检索。使用双引号检索,会自动关闭词汇转换功能,系统会将其作为一个不可分割的词组在数据库的全部字段中进行检索。

对于高级检索,高级用户可以直接通过表达式在检索词窗口中输入相应表达式进行检索。具体的字段特征标识大家可以该数据说明文件中查找。对于初级用户可以利用检索窗口下端特征栏(FeatureBar)上的Limits、Preview/Index、History、Clipboard、Details等选项完成高级检索。Limits可以对检索的范围进行限定,主要包括检索词检索途径的限制,文献类型限制,文献出版日期和录入系统的日期,可以只检索那些有文摘的记录。可以选定“年龄”、“性别”、“人或动物”。“Subsets”指只在PubMed下属的某种文献数据库中检索。Preview/Index可以让用户看到检索词及其检索途径,同时可以预览检索到的结果条目数。并且可以通过下方的检索词编辑窗口,调整检索策略,之至得到满意的结果。History可以保存用户以前的搜索策略和结果,并能组合新的搜索策略。Clipboard是在一次或几次检索中存放检索结果的地方,以便于集中存盘、打印或订购原文时使用。粘贴板最多能存放500条记录。只要粘贴板中有记录,就可点击Clipboard查看其中的记录(记录为Summary格式)。粘贴板按记录存放的先后顺序显示记录题录。Details用于查看PubMed的检索策略。即,在提问框中键入的检索词被PubMed自动地转换成了那些词,并使用了什么样的检索规则和检索语法,包括检索失败的错误信息。

检索结果的显示、存盘、打印

2)结果输出:

PubMed系统可用不同的格式显示检索结果,其默认Summary格式。结果页面输入格式如每页的文献条目、排列顺序可以用户可以自行设定。通过“sendto”选项PubMed系统可用不同的格式(同显示格式)采用不同方式(如文件、打印、保存文本、电子邮件、剪贴板和全文定购等)输出检索结果。PubMed系统允许最多可保存5000条记录。

在检索结果中,还有很多的链接,可以通过相关的链接搜索相关的文献或链接到文献的全文或文献源出版社。还可以通过“link”选项获得该文献的引文信息。也可通过页面上的“Display”下拉菜单在NCBIEntrez系统其它的数据库中进行跨库检索,检索结果为位于前面的500条信息。

PubMed系统整合在NCBI的NCBIEntrez的检索系统中,NCBIEntrez是一个包括PubMed在内的一个综合性的数据库。这个数据库建于1991年,建立时包括三个数据库,分别为核酸序列数据库(fromGenebank、PDB)、蛋白序列数据库(fromtranslatedGenBank、PIR、SWISS-PROT、PDB和PRF)。随着十多年的发展目前已扩展到十多个数据库,这些数据库与三个核心数据库构成了庞大的NCBIEntrez检索系统。通过一个入口,可以同时得到检索信息在所有数据库中的信息。这已经超出了文献检索的范畴,它将蛋白、核酸的序列信息、生物分类信息、结构信息、功能信息、系统发生信息、基因信息、基因组信息、遗传信息和相关文献信息全部整合在一起,是生命科学研究工作者必备的工具之一。该系统不但是一个检索系统,通过各种信息的整合和分析,可以让用户检索的原信息的基础上发现新的信息,因此该系统被称为发现系统(DiscoverySystem)

搜索引擎

在平时学时工作过程中,我们往往会遇到这样的情况。就是要检索的目标不知道如何分类,或者是要查询一些基本的事实而手头有没有合适的检索工具。这个时候,可以通过搜索引擎对目标进行查找,可以十分简便的获得所需的资料。而且通过搜索引擎还可能获得和检索目标相关的很多信息,有助于提供新的检索线索。互联网上各种信息纷繁复杂,如何有效的帮助用户找到所需的信息是搜索引擎建立的目的。我们简单介绍一些国内和国外的搜索引擎。

1.百度(http://www.baidu.com)

百度,2000年1月创立于北京中关村,是全球最大的中文搜索引擎。2001年10月22日正式发布Baidu搜索引擎。百度每天响应来自138个国家超过数亿次的搜索请求。用户可以通过百度主页,在瞬间找到相关的搜索结果,这些结果来自于百度超过10亿的中文网页数据库,并且,这些网页的数量每天正以千万级的速度在增长。搜索结果不佳,可以通过参考别人,来获得一些启发。百度的“相关搜索”,就是和您的搜索很相似的一系列查询词。百度相关搜索排布在搜索结果页的下方,按搜索热门度排序。如果无法打开某个搜索结果,或者打开速度特别慢“百度快照”解决问题。每个被收录的网页,在百度上都存有一个纯文本的备份,称为“百度快照”。百度速度较快,您可以通过“快照”快速浏览页面内容。不过,百度只保留文本内容,所以,那些图片、音乐等非文本信息,快照页面还是直接从原网页调用。如果您无法连接原网页,那么快照上的图片等非文本内容,会无法显示。“Googol”是一个数学名词,表示一个1后面跟着100个零。这个词汇是由美国数学家EdwardKasner的外甥MiltonSirotta创造的,随后通过Kasner和JamesNewman合著的“MathematicsandtheImagination”一书广为流传。Google使用这一术语体现了公司整合网上海量信息的远大目标。Google是万维网上最大的搜索引擎,用户能够访问一个包含超过80亿个网址的索引Google的检索界面很简洁,突出的就是检索框,可以输入关键词,然后按“google搜索”进行查找。同时也提供一个“手气不错”检索选项,点击该按钮,google会智能判断用户要检索的目标,然后直接将用户带入最相关的网页,往往能满足用户的检索需要。

在google主页上有google高级检索选项,用户可以通过高级检索来更加精确的检索所需信息。在高级搜索中,可以看到四个分别的关键词输入框,直观的表示出检索词在结果中的逻辑关系。同时可以对检索的语言、检索的时间范围、检索的文件类型和检索词出现的位置进行调整,并可限定在特定的网域内进行检索。同时,还可以以网页为搜索对象,搜索相似网页和链接该网页的网页。在这些高级检索选项中,最有用要数文件类型的限定。目前,Google能检索微软的Office文档如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,Adobe的.pdf文档,ShockWave的.swf文档(Flash动画)等。其中最实用的文档搜索是PDF搜索。PDF已经成为互联网的电子化出版标准。目前Google检索的PDF文档大约有2500万左右,大约占所有索引的二进制文档数量的80%。而我们经常要查的电子文献、电子期刊大多是以PDF格式存在的,所以通过这个限定,可以很快的找到需要的电子文献。

在google检索中,两个词以上时,要用空格格开。词直接的关系默认为“and”,用大写的“OR”来表示“或”的关系,用“-”来表示“非”,即排除。Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“”、“.”等,作忽略处理。如果要对忽略的词强制检索,要通过双引号对检索词进行标引。

通过google主页上的语言工具还可以将网页或者用户指定的文字翻译成不同的语言。对于中文,目前支持将中文翻译为英文和将英文翻译为中文,而且通过以英文为媒介,可以将中文转换为其它文字。转换的结果可以直接在google中作为检索词句,进行检索。该语言工具对于不同语种信息的查询提供了便利的途径。

Google的检索结果同样提供快照功能。在检索结果中支持二次检索。

除了我们介绍的搜索引擎外,还有一些著名的搜索引擎如国内的北大天网、国外的Yahoo等也是非常优秀的搜索引擎。

科技文献检索是一门实践性很强的科学。光有理论是远远不够的,我们要在检索实践中丰富自己的经验。培养科技文献检索的能力可以从以下几个方面入手:首先要加强情报意识,即对文献的重要作用有深刻认识,有敏锐的情报需求,能在学习工作中主动的利用文献检索这一有力工具。其次要有良好的专业知识为基础,同样的文献检索的结果,具备不同专业知识基础的人去看,得到的结果是不同的,特别是通过搜索引擎往往能搜索到很多的网页,而怎样找到所需要的信息,往往有良好专业知识基础的人能更容易找到所需的信息。第三是要善于利用各种检索工具的特点,不同的检索工具,不同的数据库,不同的搜索引擎有不同的特点,要善于根据检索需求选择合适的工具。第四要有不怕挫折的品质,不能检索不到就放弃。要善于从检索结果中分析检索策略的有效性,从而及时调整。如找不到目标词的时候,可以考虑检索目标词相关联的词,往往能检索出好的结果。总之,要通过不断的实践、总结才能真正掌握科技文献检索这一有力工具。



河北师范大学郭毅























21



















































献花(0)
+1
(本文系薛定谔的笔...首藏)