文献信息检索与利用
The retrieval and applications of the information resources
授人以鱼 只供一饭之需
教人以渔 则终身受用无穷
有用的信息——鱼
信息检索与利用的技能——捕鱼法
第一章 经济文献信息检索的基本知识
相关概念介绍
图书馆简介
第一节 基本概念介绍
一. 信息
信息在自然界、人类社会以及人类思维活动中普遍存在。
信息最初的表现形式就是信息活动。
信息作为一个科学概念,是在19世纪提出的,申农的《通讯的数字理论》和维纳的《控制论》,奠定了信息论的基础。
“物质、能源、信息”被称为现代社会的三大支柱。
二. 知识
知识是人脑意识的产物
是经过人脑加工系统化了的信息
信息包含知识
知识是信息的一部分
知识—序列化、系统化的信息
三 . 科学
记录于图书的知识体系
人类信息的高级发展形式
学问达到最高程度的部类
反映自然、社会、思维的客观规律的分科的知识体系
四. 情报
基本属性:传递性、知识性、实用性
情报对于不能认识和不能理解的人来讲,只不过是一般信息而已。
有人估计所谓机密情报,70%以上可以通过公开出版物获得
五. 文献
记录有知识的一切载体。
文献是信息、知识、科学、情报的存贮载体和传递工具之一。
文献中记录的知识并非都是情报,只有当这些知识传递给用户并为用户解决特定问题时,文献中的知识才转化为情报。
六. 文献信息
文献信息是文献中所记录的信息
文献侧重物质属性,文献信息侧重信息属性、价值属性
文献信息作为文献的价值内涵而存在
我们利用的主要是存贮于文献上的信息
七. 经济文献
依附古籍的经济文献
逐步独立的经济文献
类型多样的经济文献
类型:按文献级次划分
零次文献、一次文献、二次文献、三次文献、四次文献
按文献出版形式划分
经济图书、经济连续出版物、经济政府出版物、经济会议文献、经济学位论文、特种经济文献、经济检索工具书等
八. 信息交流
“彼此交换苹果,你我仍各有一个苹果;
彼此交换思想,每人各有两种思想”
信息知识反复循环,不断增值的过程
非正式交流、正式交流
文献信息机构
第二节 图书馆简介
对信息、知识的物质载体进行收集、加工、整理、积聚、存贮、选择、控制、转化和传递,提供给一定社会读者使用的信息系统。
图书馆是文献信息的存贮与传递中心。
六大要素:藏书、读者、人(馆)员、建筑和设备、技术方法、管理
高等学校图书馆为教学科研服务
现代化大学的三大支柱——师资、教学设备、图书资料
第二章 经济信息检索原理与步骤
经济信息检索的原理
经济信息检索的步骤
第一节 经济信息检索的原理
信息检索即借助于检索工具,运用科学的方法,从众多的信息中查找所需信息的过程。
经济信息检索就是利用检索工具从大量的信息集合中查找出切题的经济信息的过程。
信息检索的研究内容
有关检索语言的研究
有关检索系统的研究
有关检索策略的研究
有关检索服务的研究
信息检索包括存贮和检索两个环节
存贮是为了检索,要检索就必须存贮
检索提问标识与文献特征标识进行比较
二者一致,或后者包括前者时则为命中。
经济信息检索的原理:按照经济信息存贮的同一思路,采取相同的方法将输入在检索工具或检索系统中的相关知识和文献查找出来。
经济文献检索:以原始文献为检索对象。
•如:近几年国内发表了多少关于“市场经济”研究的论文?
•经济事实检索:以具体疑难问题为检索对象。
•如:什么是“标杆管理”,它起源于哪个国家?
•经济数据检索:以单纯的数值形式表示的数据为检索对象。
•如:1999年我国“国民生产总值”是多少?
经济全文检索:以原始文献全文为检索对象,是计算机检索的发展方向。
如:邓小平关于“一国两制”有哪些论述?
经济超文本检索:以国际互联网上的各种文本、活动或静止图像、声音等信息为检索对象,进行屏幕显示或用某种载体下载。
如:在国际互联网上查找世界对印巴核试验的反应?
文献信息检索是一种相关性的检索;其他几种信息检索是一种确定性检索。
文献信息检索是通过二次文献来解决;而数据与事实信息检索是通过三次文献来完成;全文及超文本检索则需借助计算机通过相应的检索系统来实现。
第二节 经济信息检索的步骤
一 . 分析研究课题,了解检索要求
二 . 确定检索标识
三 . 选择检索工具
四 . 确定检索途径
五 . 选择检索方法
六 . 查找文献线索,索取原始文献
分析研究课题,了解检索要求
所谓检索课题是解决特定问题的需要所拟定的问题。
明确检索课题的类型
• 文献类检索、 事实类检索、 数据类检索、全文类检索、超文本检索
确定课题的学科、主题范围
•尤其是新学科领域的研究课题
了解课题的检索目的和检索要求
•同样的用户检索提问,如果检索目的不同,检索过程就会截然不同。
•检索要求指查找文献的语种要求、国家或地区要求、文献年限要求、文献类型要求等。
掌握与课题有关的背景知识和专业知识
•课题的历史与现状、用户已掌握的资料线索、用户技术背景等。
确定检索标识
•检索标识是检索课题包含的,提供查找的某种线索。它包括所属学科、主题、时间范围、人物、史实、字词等。每一检索课题都包含一个或多个甚至一系列的标识,应该分析出主要的、有检索意义的标识,只有确立了有检索意义的标识,才能选择合适的检索工具、检索途径和检索方法。
选择检索工具
首先要从类型上确定为何种类型的工具书
(目录、索引、文摘、字典词典、百科全书、年鉴、手册、名录、表谱图录、资料汇编等)
其次要确定某种类型的具体工具
确定检索途径
•根据文献的内容特征和外表特征,文献检索途径可以分为分类途径、主题途径、题名途径、著者途径、序号途径等。
•采用何种检索途径,主要受检索工具正文编排及索引类型的限制。
•若检索要求涉及某一课题的各个方面,所需文献较广(族性检索),则选用分类途径较好;反之,若检索要求涉及某一课题的某个方面,所需文献范围较窄(特性检索),则应选主题途径较合适。
充分运用已知的文献外表特征途径;注意各种途径配合使用。
选择检索方法
常用法:根据课题要求,直接利用文摘或索引等各种检索工具查找选择有用的信息的方法。
顺查法:在计划查询年内,按照时间顺序由前到后的查找方法。查全率高,但效率低。
•倒查法:在已知文献大致收藏时间范围的情况下,按照时间逆序由后向前的查找方法。效率高,但查全率较低。
•抽查法:针对学科发展特点,单独抽出学科发展迅速、文献发表较多的年代进行查找的方法。效率高,但漏检的可能性较大。
•追溯检索法:以文献所附的参考文献、有关注释等为线索逐一追溯查找的方法。检准率低。
•循环检索法:以上几种检索方法的交替循环使用。
查找文献线索,索取原始文献
•文献类信息检索通过光盘数据库检索、国际联机检索、网上信息检索一般获得的是文献全文。而通过书本式检索工具获得的大多是原始文献清单,需由其出处项判断其为何种类型文献,然后通过有关单位,获得原文。
由出处项判断文献类型
•图书:著 B(Book)
•书名、著者、出版地、出版者、出版时间、ISBN号。
•期刊:刊 J(Journal)
•刊名、年、卷、期、起讫页码。
•专利文献:专 P(Patent)
•国别代码、专利国际分类号、专利类型。
•会议文献:会 Proc或Meet
•会议名称、会议召开的地址、会议届次及时间等。
学位论文:学 DISS
(Dissert)
学位名称、颁发学位的大学名称、地点、授予学位的地点
第三章 检索性工具书
基本知识
目录、文摘、索引的特 点、用途
第一节 检索性工具书的基本知识
检索性工具书的概念、作用、特点
是在一次文献的基础上整理编制的提供文献资料线索的二次文献。
用途上——查考性
内容上——概括性
编排体例上——易检性
报道作用
存贮作用
检索作用
类型
按信息加工的手段或设备划分:
手工检索工具、机械式检索工具计算机检索工具
按出版形式的不同划分:
书本式检索工具、卡片式检索工具、缩微式检索、机读式磁带磁盘光盘数据库
按摘录方式的不同划分:
目录、文摘、索引
检索性工具书的评价
收录的全面性
检索的方便性
报道的及时性
检索效率
收录的全面性
覆盖面:是指检索系统收录范围所覆盖的学科面和出版物类型及其数量。
摘贮率:是指检索系统收录的文献信息数量与其覆盖面内全部文献信息数量的比率。
报道数:是指在一定的时间内报道文献信息的数量,如文摘的条数。
检索的方便性
编排组织科学合理
索引系统完备
索引深度适中
标识的专指度高
报导的及时性
缩少“时差”
时差是指文献信息从其发表到检索系统提供给用户的这段时间间隔。
检索效率
两个指标:检全率、检准率
检全率 a/a+c%
检准率 a/a+b%
漏检率 c/a+c%
误检率 b/a+b%
检全率和检准率有反比例关系
检索系统的质量
(课题检索效果)评价指标
第二节 目录
著录一批相关的文献,并按照一定的次序编排而成的一种揭示与报导文献的工具。
•馆藏目录:反映一个图书馆收藏文献状况的书目。
一般常用的有分类目录、书名目录、著者目录和主题目录四种。
分类目录
按文献内容的学科性质进行分类后,按分类法的类目秩序组织起来的目录。
分类目录的排列规则按《中图法》的体系编排,其具体排列规则如下:
A . 先按字母顺序排,字母相同,按字母后的第一位数字大小排,第一位数字相同,再按第二位数字的大小排,依此类推。
F23 会计
F239 审计
F27 企业经济
F74 国际贸易
B . 当分类号码完全相同时,则按书次号(种次号)顺序排。
F23/20
F23/36
分类目录从知识门类方面揭示文献,它能揭示出学科之间的关系,达到按类求书的目的。
《中国图书馆分类法》
大型综合性图书分类法
《中图法》主要是从科学分类和知识分类的角度来揭示文献内容的区别与联系,按学科和专业集中文献,提供从科学和专业角度出发检索文献的途径。
分类法将知识门类分为“哲学、宗教”、“社会科学”、“自然科学”三大部类。在本分类系统中,首先反映社会科学、然后是自然科学。其五大部类序列为:
马克思主义、列宁主义、毛泽东思想、邓小平理论;哲学、宗教;社会科学;自然科学;综合性图书。
在五个基本部类的基础上,形成22个大类的知识分类框。
序列为:
《中图法》
《中图法》采用汉语拼音与阿拉伯数字的混合制号码。用一个字母标志一个大类,以字母的顺序反映大类的序列。在字母的后面用数字表示大类下类目的划分,其中“T 工业技术”下的二级类目用两个字母标志。如“TP 自动化技术、计算技术”
分类号码的每三位数后加小圆点“。”,以起号码清楚、易于辩认、隔段标识的作用。
《中图法》后有六个辅助表:总论复分表、世界地区表、中国地区表、国际时代表、中国时代表和中国民族表。
F 经济
F2 经济计划与管理
F23 会计
F234 各种会计和簿记
F234.1 社会会计
F4
工业经济
F49 信息产业经济
书名目录
按书名字顺进行排序组织起来的目录,其职能是从题名这个特征来检索特定文献。
其排列规则如下:
A 按题名的第一个字的汉语拼音字母的顺序排列,如果首字相同,再按第二、第三及其以后各字的汉语拼音排。
《会计学原理》
《中国大百科全书》
《中国旅游经济》
B 题名完全相同再按责任者或出版单位的字顺排。
《高等数学》北京大学数学系编
清华大学数学系编
C 特殊情况:
题名以外文字母、阿拉伯数字、罗马数字、公元纪年开头的,按此顺序排于全部题名款目后面。
著者目录
著者目录是按著者名称的字顺进行排序组织起来的目录。
其职能:一是从责任者入手检索特定文献
二是集中图书馆所收藏的同一责任者的全部著作,以及有关评论该责任者的著作。
著者目录的排列规则同书名目录基本相同。其比较特殊的地方如下:
(1) 有两个或两个以上著者时,按第一著者的汉语拼音排,合著者排在同姓名、单人姓名之后
(2)外国人姓名通常是名在前,姓在后,排时按姓排。
(3)同一著者的不同著作,按书名字顺排。
鲁迅 《鲁迅全集》
《朝花夕拾》
主题目录
主题目录以表示文献内容主题的规范化语词为检索途径,并按字顺排列组织的一种目录。它从内容题材方面揭示馆藏所包含的各个主题。
其排列规则如下:
(1)将主题相同的款目排在一起,先排单字主题,后排词不达意组主题。
(2)主题相同,按副主题字顺排。
(3)主题和副主题完全相同,按文献题名或责任者字顺排。
机读目录 MARC
•Machine-Readable
Catalogue
是供计算机阅读的一种目录,其文献目录信息被记录在计算机存贮载体上。机读目录必须具备三个条件:
目录信息完全以计算机识别的代码出现
目录信息完全以计算机识别的方法组织
目录信息完全存贮在计算机存贮的外部介质上。
机读目录产生于美国国会图书馆
MARCI MARCII RECON COMARC
《中国机读目录通讯格式》 UNIMARC
UNIMARC格式:
头标区、地址目录区、数据字段区
机读目录提供的检索途径
提供分类、书名、作者、主题词、出版年、ISBN号等检索途径。
ISBN号——国际标准书号(International Standard Book Number)由10位阿拉伯数字组成,分为4个部分。数字间用连字符或空格隔开,书号前均有“ISBN”字样。
4个部分:
组号代表国家、地区或语种。
出版者号由国家或地区的ISBN中心分配。
书名号是由出版者给每种出版物编的号码。
检验号是这了避免转抄或印刷过程中出现错误用计算机自动校验而设置的。
如:ISBN 7-300-02203-0
现代企业法律制度/赵中孚,刘文华
文摘
检索工具的主体,二次文献的核心
以简炼的形式将文献的主要内容准确扼要的摘录下来,并按一定的著录规则与排列方式系统地编排起来的检索工具。
与普通新闻文摘的区别:具有学术性、系统性
类型:
指示性文摘:在著录文献外表特征的基础上,再加上简短的内容介绍,主要交待论文探讨问题的范围与目的,以使读者对论文内容不产生误解为原则,字数一般在60-70字。
报导性文摘:在著录文献外表特征的基础上,基本反映原文创造性部分的全部内容,并指出该文献引用书目和插图的数目,最后署上摘要人姓名,字数一般在400-500字左右。文摘的结构
整体文摘结构:前言、凡例、编辑说明;正文;各种辅助索引
单篇文摘结构: 题录、文摘正文、补充著录项目
题录部分是文摘款目中描述文献外在特征的部分,一般包括文摘号、文献名称、著者、原文出处、原文文种等,它起着导向原谅的作用。题录部分的著录必须完整而准确。
文摘部分是对一份文献的内容所进行的简略而准确的描述。
补充著录项目包括文摘员署名和参考文献图表数量。
如:图8表5参9
文摘正文的撰写要求
文摘不是对论文进行评价,只需真实地反映原论文的主要内容。
文摘具有高度的概括性。
文摘应自成整体,不要分段分节。
论文题目可视为文摘的一部分,文摘时首句不应重复原文题目。
文摘一般采用第三人称。
文摘中应尽量避免公式或图表。
索引
将图书、报刊资料中的各种事物名称(字、词、人名、书名、篇名、内容、主题等)分别摘录,再加注释,说明出处、页码,然后按字顺或分类编排,附在书后或单独编辑成册的一种检索工具。
•索引与目录的区别在于目录只对文献作整体著录,而索引著录文献中的内涵,其揭示事物较深入、全面、明细。
•分类:著者索引、题名索引、语词索引、主题索引、分类索引、文献序号索引等
具体索引例子
选自《全国报刊索引》
010807830 知识经济时代的营销特色/周本存(安徽财贸学院贸经系)//商业研究.-2001(2).-137-139
图书馆目录部分实习题
要求:
每一题需写出符合要求的
图书目录的书名、作者、索书号
第一题
你常用的五种书(要求有一种是计算机方面的,并且是以英文字母开头,如Windows 95或Internet等)图书馆是否收藏,若有他们的索书号是多少?
第二题
查找你所熟悉的一名文学家和一名经济学家,他们的哪些著作图书馆有收藏。
第三题
查找关于下列专题的图书的目录信息(任选两个专题,每专题要求找出三种书)
1. “市场经济”专题(F123.13或F123.9)
2. “四、六级考试”专题(H319-44或H310.42)
3. “企业经济”专题(F27)
4. “国际金融”专题(F831)
5. “运筹学”专题(O22)
6. “关贸总协定”专题(F744)
7. “财政学”专题(F810)
8. “会计电算化”专题(F23-39)
9. “投资经济学”专题(F830.59)
10. “股票、证券交易”专题(F830.9)
11. “人力资源管理”专题(F240)
12. “审计”专题(F239)
13. “经济法”专题(D922.29
14. “统计学”专题(C8)
15. “计算机网络”专题(TP393)
16. “计算机程序语言”专题(TP312)
文摘部分实习题
任选本专业或相关专业方面的一篇论文或一本图书,并为其作文摘。所作文摘需包括题录、正文、补充著录项目三大部分。
第四章 主要检索性工具书简介
相关综合检索性工具书
经济类检索性工具书
著录标准、检索途径
国家标准《检索期刊条目著录规则》
统一著录项目、著录顺序、著录符号。
标准文献(分整本文献、单篇文献)条目著录格式(见书)
检索途径主要有分类途径、主题途径、著者途径、分类途径检索
(1)根据课题内容,确定分类号
(2)由分类号查其各期或年度的分类索引,记下与该课题有关的文献的序号
(3)根据该号查阅有关各期的检索性工具书,选出符合要求的文献,记录下出处。
(4)由出处提供的信息,阅读或复制原文
主题途径检索
步骤同分类途径检索基本相同
著者途径检索
(1)根据著者姓名字顺查找著者索引,得到相应的序号。
(2)根据该号查阅有关各期的检索性工具书,记录下出处。
(3)由出处索取原文
国内相关综合检索性工具书
全国新书目
由版本图书馆编辑,月刊。该书目收录的全部是根据呈缴本制度呈缴版本图书馆的国内公开出版的书籍及少量报刊。现用《中图法》分类排列,按照国家标准进行著录,该书目能较迅速地报道全国每月各类图书的出版情况,是搜集原始资料和掌握最新图书信息的重要来源。
全国总书目
是《全国新书目》配上题名索引和著者索引后的年度累积本。该书目记录每年各地出版社公开出版与发行图书的基本情况,每年出版一册,是具有图书鉴性质的全国综合性目录。
国内相关综合检索性工具书
《全国报刊索引》
上海图书馆出版,是我国自有报刊索引以来收集最多、最完整、持续时间最长的报刊资料工具书。月刊,从1990年开始按哲学社会科学版(哲社版)和自然科学技术版(自科版)分册编辑出版。该索引的体例大体上按照《中图法》自编的《全国报刊资料分类表》22个大类编排资料。检索途径是通过“分类目录”进行检索。哲社版附有著者索引和题中人名索引,收录报刊名半年刊印一次。
注意区别“著者索引”和“题中人名索引”。
•著录格式
•著者索引:
厉以宁
010811041
•题中人名索引:
江泽民
010800079
010800083
……
国内相关综合检索性工具书
《复印报刊资料索引》
中国人民大学出版资料中心编印。为《复印报刊资料》的篇目索引。条目的著录项目为篇名、作者、原载报刊、复印资料页码等。
《内部资料索引》
上海社会科学院图书馆编辑,收录国内社会科学方面的内部交流和部分内部发行期刊所发表的论文资料篇目。分内部资料文摘、专题索引、分类索引、文献信息研究四大部分。其中专题索引主要反映重大现实问题和理论问题。分类索引是主体。
国外相关综合检索性工具书
《国外社会科学论文索引》
中国社会科学院文献情报中心主办,月刊。该索引专门收录国外的社会科学期刊文献,涉及的内容包括哲学、经济、文学、历史、社会学、政治学、法律、教育、图书馆学情报学、语言学、科学学和未来学。本索引除俄文、日文单独编排外,英、法、德等采取混合编排方式。条目著录内容包括作者、原文篇名、出版、译文等
美国《科学引文索引》SCI
文献A引用或参考了文献B,我们便称文献B是文献A的“引文”右“参考文献”。
中国《社会科学引文索引》SSCI
反映在科学交流活动中,科学文献或学科之间的内在联系。
引文分析法是评价学术成果适量的一种重要方法。
国内经济类检索性工具书
《经济学科论文索引》
本索引收国内公开和内部发行的全国性、省、市、自治区以及地方性的经济方面的中文期刊近九百种以及主要经济类报纸中的论文,按月更新。该索引按〈资料法〉(第三版)进行标引,正文后附著者索引。
《经济学文摘》
《管理科学文摘》
国外经济类检索性工具书
《国外经济文献索引》
本索引采取“博采兼收”的收录原则,较广泛地选录外国刊物上的经济论文和介绍各国经济状况的文章及资料;同时兼顾选录一些与经济有关的政治、军事、科技、文教等方面的文章。该索引共分经济理论、世界、各大洲、各国经济四部分,著录的条目分为篇名项、原文项和出处三个项目。书末附索引收录刊物有收藏的国内科研单位和高等院校馆藏单位,为读者提供查阅的方便。
实习题
(书目、索引、文摘部分)
1. 全国出版了哪些在有关本专业方面的著作。
2. 厉以宁曾发表了哪些文章,这些文章被何种刊物收录?
3. 查找内部资料中对“社会主义市场经济”或“技术引进与外资利用”专题论述的文献。
4. 有哪些文章涉及到江泽民,分别发表在哪些刊物上?
5. 有关美国企业经济的日文文献有哪些?
6. 近年来发表的有关本专业方面的论文。
第五章 情报检索语言
检索语言概述
主题语言
《汉语主题词表》
第一节 检索语言概述
加强文献标引人员同检索人员之间的联系,达到存贮与检索的一致性,保证文献高度有序化的一种规范。
“国际贸易条约和协定”专题— F744— 该专题文献
检索语言是应文献信息的加工、存贮和检索的共同需要而编制的专门语言,属于人工语言。
检索语言的作用
见第二章文献存贮与文献检索的流程图
在文献存贮过程中,标引人员利用人工化的检索语言来标引、存贮文献。
在文献检索过程中,检索人员利用同样的检索语言把文献检索出来。
沟通情报的存贮和检索两个过程、标引人员和检索人员、读者用户之间思想的桥梁。
检索语言的概念
情报检索语言是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。
检索语言的类型
分类语言
用分类号来表达文献主题概念,将各种概念按学科性质进行分类和系统排列。包括体系分类语言和组配分类语言。
主题语言
用语词来表达各种概念,将各种概念不管其相互关系完全按字顺排列。包括标题词语言、单元词语言、关键词语言和叙词语言。
代码语言
一般就事物的某一方面特征用某种代码系统加以标引和排列。
先组式语言
在检索之前表达文献主题概念的标识已经预先选定和搭配的检索语言。
后组式语言
指表达文献主题概念的标识在检索之前未固定组配,而是在检索时根据实际需要按组配规则临时组配的检索语言。
第二节 主题语言
标题词语言
单元词语言
关键词语言
叙词语言
标题词语言
用经过标准化处理的名词术语作为标识,来直接表达文献所论及或涉及的事物主题,并将全部标识按字顺排列用以集中文献的语言称标题词语言。
构成原理
1. 按主题(文献所论及或涉及的事物)集中文献。
2. 用经过规范化的语词直接标引文献主题。
3. 用参照系统间接显示主题之间的相互关系。
4. 用字顺序列直接提供主题检索途径。
按主题集中文献
贸易
茶
—— 种植
制造工艺
参照系统
参照系统由“见”、“参见”和注释组成。
“见”(see)用于等同关系的显示。
蕃茄见西红柿
“参见”(see also)用于等级关系和相关关系的显示。
海关参见关税、海关法、走私
注释:当标题词概念不明确时,采用注释的形式对该标题词做简要的说明。例子:选自美国的《工程索引》
见教材第28页
特点:
专指性强
灵活、方便、及时
直接性好
不能自由组配,对多途径检索和自由扩检、缩检限制很大
族性检索能力差
标题表难以统一
单元词语言