信息组织 | 信息组织的基本原理

1. 语言学原理

1.1 信息组织的语言工具

情报检索语言

  1. 检索语言的目的是用于标引和检索,而根本的目的是满足检索的需要。
  2. 它是一个规范化的概念体系,能准确表达信息主题并显示其相互关系。
  3. 它是有序的,可用于系统排序。
  4. 是一种人工语言。

1.2 检索语言的类型

1.2.1 基本划分

张琪玉教授关于检索语言类型的划分。

  • 按构成原理分的类型。
  • 按所包含的学科或专业范围分的类型。
  • 按适用范围分的类型。
  • 按标识所用语言文字分的类型。
  • 按标示的组合使用方法分的类型。

切尔内关于检索语言类型的划分。

  • 先组情报检索语言
  • 后组情报检索语言
  • 题录引文语言

1.2.2 检索语言的谱系分类方法

  所谓检索语言谱系分类是指按各种语言的亲属关系划分的分类方法。

  谱系分类是将检索语言按语系语族语支和语种体系划分的一种方法。

  • 语系是谱系分类最上位概念。
  • 语族是语系的进一步划分。
  • 语支是语族的进一步划分。
  • 语种指具体的以某一种语言词典为基础的语言。

分类检索语言有三个语支

  • 等级体系分类语言:直接体现知识分类的等级制概念标识系统。某些外表特征。
  • 分析综合分类语言:印度阮冈纳赞的《冒号分类法》
  • 半分析综合分类语言:国际十进分类法

主题检索语言

  • 标题词语言:按标题字顺排列的一种组织检索工具的检索语言
  • 单元词语言:后组式的语言形式,代表人物:陶伯
  • 叙词语言:以概念组配为基础。

1.3 语言学在信息组织中的应用

  张琪玉的《情报检索语言语法体系初探》就是我国第一篇用语言学研究体系来探讨检索语言体系结构的论文。

计算语言学可以归结为以下三个方面

  • 自动编排
  • 自动分析
  • 自动研究

  在语言学中运用词频统计分析是定量研究的传统内容。

1.4 检索语言的语法

1.4.1 语法体系构成

词汇和语法。
  传统语言学又把语法划分为词法和句法两大部分。
  语法研究是检索语言的核心所在。

1.4.2 词汇控制

词汇是标引和检索的工具。

自然语言的缺点有:

  • 同义
  • 多义
  • 语意不清或语义不确定

词汇控制:

  • 词汇控制的目的是为了使检索词符合唯一性,规律性,定型性,通用性和准确性。
  • 词汇控制是精选核心词汇,要尽可能控制词汇规模。
  • 词类控制是选取名词和名词性词组,少量的选用一些形容词。
  • 词义控制是在主题词或内部时候加限定词,加含义及范围注释或附加简明定义等。

专指度控制是指语义的内涵和外延与信息主题内容的切合程度。

1.4.3 句法控制

显性意义通常包括四种,

  • 陈述关系
  • 支配关系
  • 修饰关系
  • 平行关系

  明确句法结构的显性意义可以与句式变换和建立检索提问逻辑式直接相关
  隐性意义通过显性意义间接表现
  句法控制手段由引用次序,控制符号,句式变换。
引用次序:

  1. 显著性引用次序:按各成分的重要性排列的次序——>区分和限定,并强调限定词应跟在所限定的标题后面(实用意义大)
  2. 范畴职能引用次序:具体性递减原则。标准次序(维克利思想)。
  3. 概念关系引用次序:对一个复合主题进行概念分析,然后根据概念间的各种关系确定其引用次序(使用符号表示)

上下文从属引用次序
  控制符号:大多不在句子序列中,而是和句子平行出现。
  联号又称联符,联号方法主要有两种,第一种是词间连锁法。这种方法适用括弧把一组标引词连接起来,第二种是词间定位法,它是在每个标引词后标单号码。
  职号又称职符

  1. 其具有某一共同的句法功能的词汇用同一种符号进行控制。
  2. 用符号表示组元在句子中的职能,或者表示其关系意义。
  3. 关系符号——>《冒号分类法》

  加权既可用于标引又可用于检索,用于标引称为加权标引,用于检索称为加权检索,在检索中必须达到规定的最低阈值才算命中。

句式变换形式主要有轮排和倒置两种

  1. 简单轮排:将每个词抽出作为入口词。一般都用于建立倒排档检索系统。
  2. 词对式轮排:将标引语句中的入口词进行两两组合构成一个词对,然后将每个词对进行有序排列。
  3. 循环轮排:也称转动轮盘,能够保持标引语句的句法关系,给检索者以完整的信息,以便较准确地理解信息主题。
  4. 换轨轮排通常称结构轮排,这种轮排在其过程中着重考虑标引语句的句法结构。

  句式变换的最基本的准则是可以改变句法的显性关系,但却不能改变其隐性关系,必须保持句子的深层结构,否则就会使原句出现歧义。

2 系统论原理

创立者:贝塔朗菲
核心思想:整体观念
基本思想方法:
在这里插入图片描述
信息检索系统的发展:
手工——>联机——> 光盘 ——>互联网
信息检索系统的结构:

  • 六个子系统
  • 检索语言和标引是系统的中心环节

信息检索系统评价:

  • 查全率和查准率

3 知识分类原理

  科学分类与图书分类一致性理论
  检索语言是信息组织和知识组织的工具
哲学家知识分类体系
->代表人物:培根、哈利斯
->培根分类法
->->历史——诗歌——哲学
->倒转培根分类法
->->哲学——诗歌——历史
大百科全书知识分类体系
->亚里士多德
->不列颠百科全书
大学教学知识分类体系
->学科专业目录
->大学教材的学科体系
科学的知识分类体系
->钱学森

4 概念逻辑原理

4.1 概念的种类

**集合概念:**如,丛书
**非集合概念:**如,桌子,树
**普遍概念:**外延有两个以上的概念,如,书,人,学生
**单独概念:**外延只有一个概念,如,“长江”

4.2 概念的内涵和外延

  内涵扩大,外延缩小;内涵缩小,外延扩大
  下位类承接上位类的内涵

4.3 概念之间的关系

相容关系:

  • 属种关系:一个概念的外延包含另一个概念的全部外延。如,松树与落叶松
  • 同一关系:两概念在外研上完全重合。如,中国的首都与北京
  • 交叉关系:两概念之间有且只有一部分外延是重合的。如,青年与工人

  相容的并列关系:如桥梁下的铁路桥
  不相容的并列关系:如禾谷作物下的玉米

4.4 概念的逻辑方法

4.4.1 概念的限定与概括

限定:增加内涵,缩小外延
概括:增加外延,缩小内涵

4.4.2 概念的划分

  基本原则:划分得到的子项的外延之和应当等于母项的外延之和,划分得到的各子项的外延必须相互排斥,使用同一标准,按层次逐级划分

4.4.3 概念的分析与综合

分析:分解的研究方法——>简单的要素
综合:联系起来考察——>找出共性认识

4.4.4 概念的表达

体系表达法——>中图法
符号表达法——>叙词表
图形显示法——>欧洲传统
语义关系表达法——>本体语言

5 参考资料

《信息组织(第三版)》,戴维民主编,高等教育出版社,2014年.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章