首页 问答 正文

信息检索与利用

问答 编辑:圳川 日期:2024-12-23 11:55:55 2人浏览

信息检索与利用

课程笔记 2020年11月17日 AND, OR, NOT eg.检索“基于web的分布式协同工作环境的研究” 的相关文章 逻辑组配检索:尽管不同数据库中所用的运算符存在差异,但所执行的操作却相同。在不同的检索系统中,逻辑算符的运算次序不相同,因而导致检索结果不同。通常顺序为:AND、OR、NOT。可以用“( )”限定检索词之间的逻辑顺序。 eg.国外船舶螺旋桨的计算机辅助设计与制造 此课题的检索式为: (W),(nW),(N),(nN) 临近算符适用于数据库原始记录中的检索词相对位置的限制性检索。 (W)或( )算符——“With”的缩写 词序不许颠倒 两词之间不允许插入任何词,只许空格或连字符号 (nW)算符——“n words”的缩写 (nW)是从(W)算符引伸出来 检索词之间允许插入0-n个词,词序不允许颠倒 (N)算符——“Near”的缩写 词序可以颠倒 两词之间不许插入任何词 适用于不确定词汇之间的从属顺序关系,较为常用 (nN)算符——“n near”的缩写: (nN)是从(N)算符引伸出来 检索词之间允许插入0-n个词,词序可以颠倒 (F)算符——“ Field”的缩写 算符两侧的检索词必须在同一字段内,词序及两词间插入的词数不限 (S)算符——“Sentence”和“ Sub-field”的缩写 算符两侧的检索词必须在同子字段或自然句,词序及两词间插入的词数不限 用?和*B表示 截词算符是在检索词的适当位置截断,利用能代表该类型词的一个局部进行检索。命中文献与该类型的词紧密相关。 所谓截词,是指在检索词的适当位置截断,用截断的词的一个局部进行检索,使检索词与数据库所存储信息字符进行一致性匹配。 在外文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。借此检索可以扩大检索范围。不同的、检索系统其截词检索的截词也不同,常用截词符包括“?”、“$”、“*”等。 前方截词:截去某个词的前部,是词的后方一致性比较,也称后方一致性检索; 中间截词:截去某个词的中间部分,是词的两边一致性比较,也称两边一致性检索; eg1.wom?n 检索结果:woman、women 后方截词:截去某个词的尾部,是词的前方一致性比较,也称前方一致性检索; eg.Physic? 检索结果:Physical、physicalism、physician、physicist… 有限截词:一般使用“?”,代表0或1个字符;在检索词的词干后连续加一个或一个以上(不超过4个)“?” ,然后空一格,再加一个“?”。词干后连续输入的问号数表示限定所截字符最大的位数。最后一个问号表示截词停止的符号。 eg.cat? 检索结果:cat、cats 无限截词:一般使用“”,也可使用“?”,代表0-n个字符,也称通配符。 eg.employ 检索结果:employ、employer、employing、employment...... 用引号””表示 1.对课题进行主题概念的分析,并用一定的概念词来表达这些主题内容,同时还要明确概念与概念之间的逻辑关系。 2.把主题归到相应学科,按照选定的主题范围,明确该主题在学科体系中属于什么门类,以及与什么知识门类有关(即属于多学科或交叉学科),以便确定检索的学科范围。 1.属于基础理论性研究的,一般侧重查找期刊论文。 2.属于尖端科学技术研究的,一般侧重于科技报告。 3.属于发明创造,技术革新研究的,一般侧重于专利文献。 4.属于为产品定型设计的,一般侧重于标准文献和产品样本文献。 检索词的确定,一般包含以下几种操作: (1)切分(2)删除(3)替换(4)聚类(5) 补充(6)增加 检索词的确定总结 1.优先使用检索系统规范化词表中的专业词汇 2.选用通用的术语和词汇 3.分析课题的实质内容,找出隐含主题 4.以课题核心概念为主,排除无关概念,归并重复概念 用上位或下位的概念词 编写检索提问式时注意 ①对于同类或并列概念的词,用“逻辑或”进行组配,特别是采用自由词检索时,要尽量选全同义词、近义词等进行逻辑“或”组配;对于有交叉关系的概念,用逻辑“与”进行组配,但应注意去掉与课题无关的概念组配,以防限制过严而漏检。 ②为了提高检索速度,在使用布尔算符时,应把估计出现频率低的词放在“AND”左边,把频率高的词放在“OR ”左边,同时使用“AND”和“ OR”时,应把“ OR”放在“ AND”的左边。 ③应考虑哪些词利用截词算符,哪些地方要用位置算符,是否需用字段算符加以限制。综合利用各种算符,可提高检索效率,使检索结果更为理想。 ④应避免可能产生多种逻辑判断的组配。组配的结果只能表示一种含义。 检索结果信息量过多时检索策略的调整 产生检索结果信息量过多的原因可能有以下两点:一是主题词本身的多义性;二是对所选检索词的截词截得太短。在这种情况下,就要考虑缩小检索范围,提高检索结果的查准率。 ①减少同义词与同族相关词或减少相关性不强的检索词; ②增加限制概念,采用逻辑“与”连接检索词或进行二次检索; ③使用字段限定,将检索词限定在某个或某些字段范围内; ④使用逻辑“非”算符,排除无关概念; ⑤调整位置算符,由松变严; ⑥改模糊检索为精确检索。 检索结果信息量过少时检索策略的调整 对检索结果信息量较少的结果,可进行扩检,提高查全率。造成检索结果信息量少的原因有以下几点:一是主题词选用不正确,如使用不规范的主题词、产品俗称等;二是同义词、相关词、近义词没有运用全;三是逻辑与运算符用的过多。四是检索时各种限定过多过严。这是应该考虑扩大检索范围,提高检索查全率。 ①选全同义词与相关词并用逻辑“或”将它们连接起来,增加网络度; ②减少逻辑“与”的运算,放弃一些次要的或者太专指的概念; ③取消或放宽一些检索限定,如年限、学科、文种等; ④使用截词检索; ⑤扩大或修改检索字段限定的范围,如改题名为文摘或全文等; ⑥调整位置算符,由严变松; ⑦改精确检索为模糊检索。 索取原文的方法 ①利用我馆馆藏; ②利用我馆的数字资源上的电子期刊、全文数据库; ③利用全国高校文献信息保障系统(CALIS)的联合书目数据库; ④根据作者E-mail地址,向作者索要; ⑤通过文献传递 。 1.中文数据库 中国知识资源总库(CNKI) 万方数据资源系统 维普资讯 超星数字图书馆 书生之家数字资源平台 人大复印资料(全文) 国家知识产权局 2.专业数据库 中国经济信息网(全文) 国务院发展研究中心信息网(网络版) 财经资讯教育平台(全文) EPS全球统计数据/分析平台 3.考试及视频数据库 起点考试学习系统 网上报告厅 上业外语多媒体学习库(原环球英语) 盛大有声数字图书馆 3.1 图书出版、内容信息的获取 综合性图书(出版)网站 BookWire(书网):http://www.bookwire.com/(纯英文网站) 中国图书网:http://www.bookschina.com/ 中国互动出版网:http://www.china-pub.com/ 各出版社网站 高等教育出版社:http://www.hep.edu.cn/ 电子工业出版社:http://www.phei.com.cn/ 网上书店 当当网,卓越网 4.各种搜索引擎 3.2 《超星数字图书馆》 利用高级检索可以实现图书的多条件查询。如查找王长喜编写的大学英语的书。点击“高级检索”进入高级检索界面 1)按检索要求选择检索字段,在其后的检索框中填入检索词。(每个检索框之间选择逻辑算符:并且)。 2)点“检索”键,开始查找。显示检索结果,并逐条显示命中图书的书名、作者、出版日期、主题词、分类等,共读者选择。 3.3 《书生之家数字图书馆》 3.4 读秀学术搜索 3.5 中国知识资源总库(CNKI) 目前CNKI的主要数据库有: (1)中国期刊全文数据库:收录年限为1994年至今,收录8000多种期刊的全文文献,收全率超过99%。 (2)中国优秀硕士论文全文数据库:收录了1999年至今的,600多个机构70多万篇硕士论文全文,机构包括中科院部分研究机构和高等院校。 (3)中国博士论文全文数据库:收录了1999年至今的,400多个机构10万篇博士论文全文,机构包括中科院部分研究机构和高等院校。 (4)中国重要会议论文全文数据库:收录2000年至今的,我国300个一级学会、协会和其他同级别学术机构或团体所主持召开的国际性和全国性会议的会议论文全文。 (5)中国重要报纸全文数据库:收录2000年以来中国国内重要报纸刊载的学术性、资料性文献,连续动态更新,积累报纸全文文献540余万篇。 (6)中国年鉴全文数据库:目前国内最大的连续更新的动态年鉴资源全文数据库,收录国内公开发行的750多种年鉴全文,目前已超过1000万篇。 (7)中国工具书集锦在线:该库是2000多种语言词典、专科词典、百科全书、图鉴、年表整合而成的数据库,含词条近770万条,图片70多万张。 (8)中国高等教育期刊文献总库:收录1994年至今的我国正式出版发行的高等教育教学类期刊以及其他学术期刊中与高等教育教学有关的文献。 高级检索的功能是在指定的范围内,按一个以上(含一个)检索项表达式检索,这一功能可以实现多表达式的逻辑组配检索。 ①选择检索范围。 ②选择检索字段:在[检索项]的下拉列表选择一个要检索的字段。 ③输入检索词:在[检索词]输入框中输入检索词。 ④确定各检索词之间的关系。各检索词之间的关系有“并且”、“或者”、和“不包括”,来连接两个查询。 3.6 万方数据知识服务平台 万方数据知识服务平台包括以下子系统:学术期刊、学位论文、学术会议、外文文献、中外专利、中外标准、科技成果、法律法规和机构。 万方数据知识服务平台 (1)中国学位论文全文数据库 该库由国家法定学位论文收藏机构——中国科技信息研究所提供,收录了自1980年以来我国自然科学领域博士、博士后及硕士研究生论文,其中全文70余万篇,每年新增15万篇以上。 (2)数字化期刊群 该子系统集纳了理、工、农、医、人文等八大类100多个类目的5600多种各学科领域期刊,其中绝大多数是进入中国科技论文统计源的核心期刊,实现全文上网、论文引文关联检索和指标统计。从2001年开始,数字化期刊已经囊括了我国所有科技统计源期刊和社科类核心期刊。 (3)学术会议论文全文数据库 主要收录了自1998年以来国家级学会、协会、研究会组织召开的全国性学术会议论文,范围覆盖自然科学、工程技术、农林、医学等领域。 (4)中国标准全文数据库 收录了国内外大量标准,包括中国国家发布的全部标准、某些行业的行业标准;收录了国际标准数据库、美英德等国的国家标准,以及国际电工标准;还收录了某些国家的行业标准,如美国保险商实验所数据库、美国专业协会标准数据库、美国材料试验协会数据库、日本行业标准数据库等。 (5)中国法律法规全文库: 该库包括全国人大及其常委会颁布的法律。国务院制定的各项行政法规,地方性法规;最高人民法院、检察院颁布的案例;工商行政管理局和有关单位提供的示范合同式样和非官方合同范本;外国与其他地区所发布的法律全文内容,国际条约与国际惯例等全文内容。 (6)中国专利全文数据库 收录从1985年至今收录的全部发明专利、外观设计专利数据信息。 (7)科技信息子系统 汇集了中国学位论文文摘、会议论文文摘、科技成果、专利技术、标准法规、各类科技文献、科技机构、科技名人等近百个数据库,子系统包括:科技文献类数据库、科技成果类数据库、论文统计类数据库。 (8)商务信息子系统 该子系统面向企业用户推出工商资讯、经贸信息、咨询服务、商贸活动等服务内容。 (9)外文文献数据库 “外文期刊”主要收录了1995年以来世界各国出版的10000多种重要学术期刊,“外文会议论文”主要收录了1985年以来世界各学术协会、出版机构出版的学术会议论文,部分文献有少量回溯。 3.7 维普信息资源系统 ​ 重庆维普资讯有限公司的前身是中国科技情报所重庆分所数据库研究中心。自1993年成立以来,一直致力于电子与网络信息资源的研究、开发和应用。该数据库分为中文科技期刊数据库、中文科技期刊数据库(引文版)、外文科技期刊数据库、中国科技经济新闻数据库四个子库。 (1)中文科技期刊数据库 ​ 包含1989年以来的自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等多个学科9000余种期刊刊载的1250余万篇文献,并以每年200万篇的速度递增。 (2)中文科技期刊数据库(引文版) ​ 《中文科技期刊数据库》引文版以全文版为基础开发而成,主要检索 1989年以来国内 5000多种重要期刊(含核心期刊)所发表论文的参考文献,是目前国内检索期刊种类最多的引文数据库。该库可独立实现参考文献与源文献之间的切换检索。《中文科技期刊数据库》(引文版)是科技文献检索、文献计量研究和科学活动定量分析评价的强力工具。 (3) 外文科技期刊数据库 ​ 该数据库提供 1992年以来世界 30余个国家的 11300余种期刊, 800余万条外文期刊文摘题录信息。对题录字段中刊名和关键词进行汉化,帮助检索者充分利用外文文献资源。并联合国内 20余个图书情报机构提供方便快捷的原文传递服务。 (4)中国科技经济新闻数据库 ​ 该库遴选自国内 420多种重要报纸和 12000多种科技期刊的 305余万条新闻资讯,包括了各行各业的新产品、新技术、新动态和新法规的资讯报道,是科研机构获取行业动态,把握市场走向,建立竞争情报系统的重要信息来源,尤其是科技查新单位进行科技查新时重要的查询数据库之一。 维普数据库入口: 省高校数字图书馆维普镜像 http://vip.hbdlib.cn 或维普中心网站 http://oldweb.cqvip.com 3.8 中国年鉴网络出版总库 1.概述 中国年鉴全文数据库是目前国内最大的连续更新的动态年鉴资源全文数据库。内容覆盖基本国情、地理历史、政治军事外交、法律、经济、科学技术、教育、文化体育事业、医疗卫生、社会生活、人物、统计资料、文件标准与法律法规等各个领域。 文献来源: 中国国内的中央、地方、行业和企业等各类年鉴的全文文献, 共 2,422 种、 18,770 本、 16,034,580 篇。 (1)专辑专题 年鉴内容按行业分类可分为地理历史、政治军事外交、法律、经济总类、财政金融、城乡建设与国土资源、农业、工业 、交通邮政信息产业、国内贸易与国际贸易、科技工作与成果、社会科学工作与成果、教育、文化体育事业、医药卫生、人物等十六大专辑。 (2) 地方年鉴 按照行政区划分类可分为北京市、天津市、河北省、山西省、内蒙古自治区、辽宁省、吉林省、黑龙江省、上海市、江苏省、浙江省、安徽省、福建省、江西省、山东省、河南省、湖北省、湖南省、广东省、广西壮族自治区、海南省、重庆市、四川省、贵州省、云南省、西藏自治区、陕西省、甘肃省、青海省、宁夏回族自治区、新疆维吾尔自治区、香港特别行政区、澳门特别行政区、台湾省共34个省级行政区域出版的年鉴专辑。 外文数据库种类很多,涉及电子图书、期刊、学位论文、专利、标准、年鉴、研究报告等文献类型,几乎覆盖了所有学科。在我国,外文数据库大多数是由CALIS组团购买的。 外文数据库 --全文 SpringerLINK,Wiley,Elsevier,EBSCO --文摘 SCI-科学引文索引,SSCI-社会科学引文索引,A&HCI-艺术和人文引文索引,EI-工程索引,CPCI-S(原ISTP)-科技会议录索引(文摘) 4.1 EI Compendex Web EI Compendex Web是《工程索引》(EI)的网络版,由美国工程信息中心编辑出版,包括EI Compendex和Page One数据库两部分内容。武汉理工大学图书馆订购的Engineering Compendex Web文摘型数据库是基于因特网提供信息检索服务的核心数据库,是《EI Compendex》和《EI Page one》合并而成的Internet版本。它包括1969年至今的EI Compendex数据和1990年至今的EI Page one数据,每年新增约50万条工程类文献。其数据来自约5800余种工程期刊、会议文集和技术报告。 EI Compendex Web收录文献内容涉及工程技术领域的各个分支学科,如土木工程、能源、环境、地理和生物工程,电气、电子和控制工程,化学、矿业、金属和燃料工程,机械、自动化、核能和航空工程,计算机、人工智能和工业机器人。 Engineering Compendex Web数据库来源期刊的三个层次:即核心期刊、选做期刊和扩充收录期刊。核心期刊的所有正文都要做文摘和标引;选做期刊只选择部分正文做文摘标引;扩充收录期刊只收录正文的题目、作者和作者单位,部分收录文摘。不做主题、分类标引。 EI数据库的作者有九种写法:以王府井(Wang Fujing) 院士为例 建议采用截词符“ * ”,以三种形式来代替,并用其他检索字段来限制 建议采用截词符“ * ”,以三种形式来代替,并用其他检索字段来限制 4.2 SCIE数据库 科学引文索引(Science Citation Index,SCI)创刊于1963年,是美国科学情报研究所出版的一部世界著名的期刊文献检索工具。SCI收录全世界出版的数、理、化、农、林、医、生命科学、天文、地理、环境、材料、工程技术等自然科学各学科的核心期刊约3500种;扩展版收录期刊5800余种。 由于SCI数据库具有学科全面、学术影响大、覆盖国家广泛等特点,因而被其收录检索的期刊和论文常分别被称作国际主流期刊和国际主流科学。刊物或论文被SCI收录和引用在一定程度就反映了该刊物或论文具有较高的学术水平和较大的国际影响力。 不同检索算符的作用介绍如下: 4.3 Web of Science核心合集数据库 国际核心期刊分区标准 4.4 SSCI 数据库 SSCI即社会科学引文索引(Social Sciences Citation Index),为SCI的姊妹篇,亦由美国科学信息研究所创建,是目前世界上可以用来对不同国家和地区的社会科学论文的数量进行统计分析的大型检索工具。 社会科学引文索引SSCI (Social Science Citation Index):提供1956年以来1900多种期刊的题录、文摘、参考文献信息,涉及社会科学的所有领域。内容覆盖包括人类学、法律、经济、历史、地理、心理学等55个领域。收录文献类型包括:研究论文,书评,专题讨论,社论,人物自传,书信等。数据库每周更新。 4.5 CPCI-S数据库 CPCI-S(Conference Proceedings Citation Index-Science)是基于Web of Knowledge检索平台的一个子数据库,是原科学技术会议录索引ISTP新版,CPCI-S汇集了世界上最新出版的会议资料,提供了综合全面、多学科的会议论文资料信息。提供1990年以来以专著、丛书、预印本、期刊、报告等形式出版的国际会议论文文摘及参考文献索引信息,涉及自然科学和工程技术的所有领域。数据库每周更新。 4.6 CSCD数据库 ​ 中国科学引文数据库(Chinese science citation database CSCD),收录了1989年以来,我国数学、物理、化学、天文学、地球学、生物学、农林科学、医药科技、工程技术、环境科学和管理科学等领域出版的中英文科技核心期刊和优秀期刊的文献信息。被誉为中国的Web of Science”。 4.7 ScienceDirect(SD) 荷兰Elsevier出版集团是全球最大的科技与医学文献出版发行商之一,我馆订购的ScienceDirect系统是该公司的核心产品,包括2000多种电子期刊,涉及食品、数学、物理、化学、生命科学、商业及经济管理、计算机科学、工程技术、能源科学、环境科学、材料科学和社会科学等学科。数据库库实时更新,可及时获取在编文章。回溯时间长,可下载1995年以来的全文。 4.8 SpringerLINK 德国施普林格(Springer-Verlag)是世界上著名的科技出版集团, 通过SpringerLink系统提供其学术期刊及电子图书的在线服务。 目前SpringerLink共包含2600多种全文电子学术期刊,按学科分为:生命科学、医学、数学、化学、计算机科学、经济、法律、工程学、环境科学、地球科学 、物理学与天文学,这些期刊是科研人员的重要信息源。 4.9 EBSCOhost EBSCOhost平台提供多个数据库的使用,其中包含两个全文数据库: (1)学术期刊数据库(Academic Source Premier) 该数据库专门为学术研究机构提供的全文数据库,收录有关社会科学、人文、教育、计算机科学、工程、物理、化学、语言文学、艺术、医学、种族研究等领域的4,700多种全文期刊,其中包括3,600多种专家评审期刊;同时还收录8,175种期刊的索引和文摘。全文和文摘最早回溯到1965年。 (2)商业资源数据库(Business Source Premier) 该数据库提供8,800多套丛书的全文。提供可追溯至 1965 年的全文及可追溯至 1998 年的可检索参考文献。与商业相关的所有主题范围几乎均包括在内。 4.10 ProQuest博硕士学位论文全文数据库(全文) PQDT学位论文全文库是目前国内唯一提供国外高质量学位论文全文的数据库,主要收录了来自欧美国家2000余所知名大学的优秀博硕士论文,目前中国集团可以共享的论文已经达到304781篇,涉及文、理、工、农、医等多个领域,是学术研究中十分重要的信息资源。 4.11 IEEE/IEE Electronic Library(IEL) IEEE/IEE Electronic Library(IEL)数据库提供美国电气电子工程师学会(IEEE)和英国工程技术学会(IET)出版的242种期刊、8706种会议录、1705种标准的全文信息。其主题范围涉及计算机、自动化及控制系统、工程、机器人技术、电信、运输科技、声学、纳米、新材料、应用物理、生物医学工程、能源、教育、核科技、遥感等许多专业领域。我馆全库购买,均有全文。一般每周更新一次,每月增加25,000篇最新文献。
分享到

文章已关闭评论!