信息組織 | 信息組織主題法

本章重點與難點

重點:

  • 主題法(主要是敘詞法)的信息組織原理 主題詞表的編制;
    難點:
  • 分類法微觀體系結構;
  • 主題詞詞表組配原理;

1 主題法的原理

1.1 主題檢索的含義與特點

   主題檢索有廣義和狹義兩種所指,在國外多采用其廣義所指,我國則多取其狹義。
狹義的主題檢索
   是指用敘詞、標題詞、單元詞、關鍵詞等表達信息需求而進行的檢索。它既不同於用分類號或依類目進行的分類檢索,也區別於依被引文獻進行的引文檢索。 我們所說的主題檢索是指這種狹義的主題檢索。

主題檢索的特點

  1. 直接以事物爲中心展開檢索
  2. 以直觀的語詞表達檢索要求
  3. 以特性檢索爲主,族性檢索次之
  4. 以明確性的檢索爲主,模糊性的檢索次之

1.2 主題法的類型

1.2.1 標題法

   標題法是最早的一種主題法,它的出現一般以克特於1876年出版的《詞典式目錄規則》爲標誌。
   標題法是用規範化的自然語言語詞作標題,直接表達文獻主題概念,按照標題字順排列,並用參照系統顯示標題之間關係的 一種主題法。

標題法優缺點

■標題法具有主題法的共同優點:

  • 以事物爲中心集中信息,便於從事物出發的檢索, 特性檢索功能較強,標識直觀;
  • 它還有標識含義明確
  • 易於使用等優點。

■它的主要缺點:

  • 是由於採用標題的列舉方式和先組方式,概念表 達能力受限,概念難以多向成族,檢索途徑少;
  • 由於採用自然語詞,標識的通用性較差。

1.2.2 單元詞法

   單元詞法又稱元詞法,它是以取自自然語言,經過規範化處理的單元 詞作標識,通過單元詞的字面組配來表達主題概念的一種主題法。
所謂單元詞(Uniterm )是指用來表示文獻主題的、最基本的、在概念上不能再分解 的詞。
   單元詞法對標題法的改進主要就是用單元詞以後組方式組配表達標題語言中的那些標題。
   代表:穿孔卡系統

單元詞法的優缺點

優點:

  1. 詞表體積小;
  2. 不存在詞序問題;
  3. 通過最基本的詞彙可以表達大量專指概念和新概念;
  4. 每個單元詞都是排檢詞,都可作爲檢索入口,從而提供更多 的檢索途徑;
  5. 可進行多因素組配檢索,利用單元詞的增減,可以較自由地擴大,縮小或改變檢索範圍,檢索的靈活性較大。

缺點

  1. 由於單元詞法強調字面上的分拆和組配,導致單元詞組配的語義失真或含糊不清,造成誤檢。
  2. 單元詞之間較少存在詞間關係,因此單元詞法一般缺乏完善 的參照系統,難以滿足族性檢索的需要。

1.2.3 敘詞法

   在我國又稱主題詞法,它是以規範化的自然語言語詞爲敘詞, 作爲文獻主題的標識,通過敘詞的概念組配表達主題概念的一 種主題法。

   所謂敘詞(Descriptor)我國多稱主題詞,是取自自然語言,經過規範化處理的,以基本概念爲基礎的表達文獻主題的詞或詞組。

敘詞法的優缺點
■優點:

  1. 具有主題法的共同優點;
  2. 因採用組配方式,可以實現多向成族,多途徑檢索,多因素組 配檢索,靈活地擴檢、縮檢或改變檢索範圍;
  3. 能以較少的語詞表達較多的概念、較專指的概念、新的概念;
  4. 因遵循概念組配原則,保證了組配語義的準確性;
  5. 因採用多種手段顯示詞間關係,具有較好的族性檢索功能。

■缺點:

  1. 編制和使用的難度較大;
  2. 組配語義的明確性稍差。

1.2.4 關鍵詞法

   直接以文獻中能夠表達主題概念的關鍵詞作標識的一種準主 題法。或者說,關鍵詞法是由計算機或人工從文獻中抽取關鍵詞作標識,並按字順排列,提供主題檢索途徑的方法。
■所謂關鍵詞(Keyword)是出現在文獻題名、文摘、正文中,能夠表達文獻主題,具有檢索意義的語詞。

■關鍵詞法的主要特點:

  1. 首先,關鍵詞是自然語言的語詞,一般不作規範化處理。
  2. 其次,一般不編制受控詞表(關鍵詞表)進行詞彙控制,不顯示詞間關係,只是編制禁用詞表(非關鍵詞表)來控制抽詞。
  3. 比較適合於計算機檢索

1.3 敘詞法的原理

1.3.1 綜合性原理

敘詞法是多種情報檢索語言的原理和方法的綜合,主要表現爲:

  1. 敘詞法採用自然語言的語詞作標識,但更嚴格地對自然語言語詞 實施規範化處理或控制,以保證標識與概念之間的唯一對應;
  2. 敘詞法適當採用標題法的預先組配,選用必要的詞組,放棄單亓 詞法的語詞儘可能分解原則,以減少組配操作和組配誤差;
  3. 敘詞法採用了分面組配分類法的概念組配來取代單元詞法的字直 組配,以增強組配語義的確切性;
  4. 敘詞法採用並進一步完善了標題法的參照系統;
  5. 敘詞法採用體系分類法的原理編制敘詞分類索引(範疇索引)底 等級索引(詞族索引),甚至直接引入體系分類表或分面分類表 ,實現分類主題一體化;
  6. 敘詞法採用關鍵詞法的輪排方法,編制敘詞輪排索引。

1.3.2 概念組配原理(基本原理)

   在敘詞語言採用的多種原理方法中,概念組配是最基 本的原理,它是決定敘詞法特點和性能的根本因素。

概念組配
■操作系統接口——操作系統+軟件接口
■典型安裝——標準化+軟件安裝
■中國經濟難題一一經濟+問題+研究+中國

敘詞概念的組配類型
■交叉組配
   即同級詞組配,通常是指兩個或多個表達相同性質概念的敘詞。例如,參與組配的敘詞所表達的都是學科,都是設備,都是動物等。
在這裏插入圖片描述

■方面組配
   在一個表示某一事物的敘詞與表示事物方面(部分、屬性、狀態、過程、條件、關係等方面)的敘詞之間進行的概 念限定的邏輯推演,結果可形成一個新概念。這 個新概念表示該事物的某一方面或某一特稱。
   方面組配的範圍很廣,使用也較自由,絕大多數的敘詞組配是方面組配。
在這裏插入圖片描述

■聯結組配
   其作 用是表示兩個或多個事物之間的聯繫,實際上是方面組配的一種特殊類型。它往往是表達不同事物的敘詞 之間用表示它們之間關係的敘詞聯結起來。
在這裏插入圖片描述

■特稱組配
   是指用一個表示事物類稱的屬概念敘詞與表達“種差”(即待表達種概念比參與組配的那個屬概念多出某種特徵)的敘詞進行組配。
   一般來說表示事物的序詞與用來區分事物並表示事物的形狀、形式、度量、材料等屬性的序詞之間的組配屬於特稱組配,至於表示事物與其所處空間、時間、所屬的人物、民族所用的語言等序詞的組配,當做特徵組配比,當作方面組配更易於理解。

敘詞組配的作用主要表現爲:

  1. 可以控制詞彙量。採用組配可以大大縮小詞表的體積。
  2. 可以對同一項信息進行多途徑檢索
  3. 可以自由擴大、縮小或改變檢索範圍
  4. 可以比較及時地反映新事物、新科學

1.4 主題法的功能

  1. 對信息內容加以標引的功能;
  2. 對主題相同及相關的信息予以集中或揭示其相關性的功能;
  3. 對大量信息加以系統化或組織化的功能;
  4. 便於將標引用語與檢索用語進行相符性比較的功能。

2 敘詞法的詞彙控制

2.1 詞彙選擇

■詞類控制
  可以作爲敘詞的主要是表示文獻主題中涉及的事 物及事物特徵的各學科領域名詞術語,包括簡單名詞(單純詞和合成詞)和名詞性詞組
   少量的形容詞、數詞、副詞
■詞組控制
   詞組控制的準則應該是:若將詞組分解後用於組配,會影響用戶對其含義的正確理解或不符合用戶的使用習慣,就不應將詞組分解,而應選擇詞組作敘詞,反之,就不應該選擇詞組作敘詞(正式敘詞)

2.2 詞形控制

■詞形控制
   敘詞法的詞形控制主要是指對同義不同形的詞優選其中的一種形式作敘詞(正式敘詞),以避免信息分散而降低檢全率,有利於字順排列。
■同義詞的控制
   在詞義相同而詞形不同的語詞之間,只能優選其中的 一個作敘詞,其餘的則可以作爲非正式敘詞(入口詞)收入詞表
準同義詞的控制
   準同義詞,是指含義相近或不同,但在標引和檢索時沒必要予以區分,可以作爲同義詞處理的那些詞。

2.3 詞義控制

敘詞法的詞義控制
   主要是對多義詞(同一詞形表示的多個詞義有相關性)、同形異義詞(同一詞形表示的多個詞義之間不相關)和詞義含糊而導致理解不一的詞進行處理,使敘詞的詞義具有單一性和明確性。
■敘詞詞義控制主要採用以下措施:

  1. 加限定詞;
    凡是一詞多義,可以對本義不加限定,對轉義加限定,也可以全部加限定。
  2. 用註釋;
    含義註釋、用法註釋、歷史註釋
  3. 其它措施:

2.4 詞間關係控制

■詞間關係符號

在這裏插入圖片描述

■等同關係詞匯控制

  • 等同關係
    • 是指敘詞與非正式敘詞之間的關係;
    • 漢語敘詞表的詞間等同關係用字母"Y"和"D"表示。

■等級關係詞匯控制
等級關係
   是指上位敘詞和下位敘詞之間的關係,亦稱屬分關係。敘詞 等級關係是雙向顯示的。

漢語敘詞表中,敘詞之間的等級關係參照符號有:

  • "S"是上位敘詞的指引符,用在下位敘詞下,指出它所屬的上位敘詞;
  • "F”是下位敘詞的指引符,用在上位敘詞之下,指出它的 下位敘詞;
  • "Z"是族首詞指引符,用在依等級關係構成一族的,除族首詞及族首詞的直接下位詞之外的其它敘詞下,指出它所屬 詞族的族首詞(一族詞中最泛指的上位詞)。

敘詞之間的等級關係,主要包括:

  • 屬種關係
  • 整體與部分關係

   ■相關關係詞匯控制

   相關關係的顯示是雙向的,所用的參照符號只有一個,在漢語敘詞 表中用"C"表示相關關係。

   相關關係的範圍很廣,靈活性很大,種類很多,很難嚴格界定。

3 敘詞表的結構和編制

3.1 敘詞表的宏觀結構

一般宏觀結構:
在這裏插入圖片描述

3.1.1 字順表(主表)

  字順表是將衆多敘詞款目和非正式敘詞款目按字順排列的詞彙表
  敘詞包括普通敘詞和專有敘詞兩大類

3.1.2 專有敘詞表

  ■專有敘詞的範圍較廣,如地區索引、人物索引、 機構索引、產品索引等。

  ■單獨設立專有敘詞表的目的主要有兩個:
    1. 壓縮字順表的篇幅,方便從字順表查詞;
    2. 便於用戶迅速查到所需的專有敘詞,不必去詞量較多的主表中查找。

3.1.3 輪排索引

  輪排索引又稱輪排表,是將敘詞按其詞素的字順輪流排列到檢索入口,使含有相同次數的詞集中在一起的。
  輪排索引的輪排方式有三種,一種是詞外輪排; 二是詞內輪排,三是倒置輪排。

3.1.4 雙語種對照索引

  ■雙語種對照索引

  是將全部或大多數敘詞和非正式敘詞與其外語譯名相對應,按外語譯名字順排列的索引。我國的敘詞表多編制英漢對照索引。

  ■雙語種對照索引的功能:
    1. 提供從對照語言的語詞字順入手查詞的途徑;
    2. 幫助查找對照語種文獻。

3.1.5 字順索引

  ■字順索引
  是將敘詞(或包括非正式敘詞)按字順排列,而 不包含敘詞款目中的其它項目的一種索引。
  ■字順索引的功能:提高主表査詞速度

3.1.6 入口詞表

  ■入口詞表
  是將非正式敘詞按字順排列,並指出其對應敘詞 的索引。
  ■入口詞表的功能:
    1. 提高查詞速度;
    2. 減少選詞錯誤

3.1.7 範疇索引

  ■範疇索引
  是按敘詞表全部敘詞和非正式敘詞所屬學科或範疇編制的詞彙分類索引。

  ■範疇索引的功能:

    1. 便於從學科或專業角度查找敘詞;
    2. 用於組織分類主題目錄(索引)式的檢索工具

3.1.8 詞族索引

  ■詞族索引
  是將字順表中具有等級關係的需 成詞族,並按各詞族的族首詞與 引。
  ■詞族索引的功能:

    1. 提供從族首詞出發,查找所需侖
    2. 藉助上位詞,下位詞和同位詞,
    3. 方便進行擴檢和縮檢

3.1.9 分類表

  ■分類表
  是指實現分類主題一體化的詞表中,與字順表相配合的分類表,它不同於敘詞分類索引。
  ■分類表的功能:
  幫助從學科分類的角度查表選詞

3.1.10 敘詞關係圖

  形象、直觀但編制複雜
  環形圖、箭頭關係圖、樹形結構圖

3.2 敘詞表的微觀結構

3.2.1 字順表的微觀結構

敘詞(主題詞)款目的著錄項目一般包括:

  • 款目敘詞項
  • 漢語拼音和對應的外語(英語)譯名
  • 標註項
  • 參照項

非正式敘詞(又稱非正式主題詞)款目包括:

  • 款目詞項
  • 標註項,不包含註釋項
  • 參照項,僅有"用"參照項,指出代替它的敘詞

款目詞的排列
一般按字順排列

漢語敘詞表:

  • 音節—音調—字形順序排列法
  • 音節順序—字形順序排列
  • 逐字母排列法

西文敘詞表:

  • 逐詞排列法
  • 逐字母排列法

3.2.2 範疇索引的微觀結構

  ■類目(範疇)的設置。一方面應以學科分類爲基礎,另一方面應該考慮詞彙分類的需要。一級類目一般是較大的學科、專業領域,類目細分一般只到二級或三級。
  ■類目的組織。範疇索引的類目大多是按類目內容的邏輯聯繫加以組織,類似於等級分類體系,我國的敘詞表均是如此。
  ■類目的標記符號。一般採用層累制
  ■各類下詞的組織。範疇索引收入主表的全部敘詞和非正式敘詞,附表的詞因本身具有明顯的範疇劃分性質,一般不再收入範疇索引。敘詞和非正式敘詞只放入每個類系的最下一級類,並在類下按字順排列。

3.2.3 詞族索引的微觀結構

  ■收詞限制。詞族索引只收字順表和附表中具有等級關係的敘詞。 沒有等級關係的敘詞不收入,非正式敘詞不收入。
  ■詞族的確定。族首詞應是外延較寬、內涵較淺並且有實際檢索意義 的敘詞。
  ■族內詞的確定。各詞族內的敘詞先按等級關係分級排列,並且前置小圓點表示等級:族首詞前不加小圓點,二級詞前置一個小圓點,三級詞前置兩個小圓點,依此類推。
  ■詞族的排列。每個詞族依其族首詞字順排列,漢語詞族索引一般按 族首詞的漢語拼音排序。

3.2.4 雙語種對照索引的微觀結構

  ■譯名的範圍
  一般應收錄全部敘詞及非正式敘詞的譯名。但是,如果有些敘詞難以找到合適的譯名,也允許空缺。
  ■譯名的單複數形式
  對於一般科技名詞,其英譯名依英文習慣,可數名詞用複數,不可數或集合名詞用單數;對錶示學科專業領域、工藝過程以及事 物的性質、狀態、特性的詞,—般用單數形式。
  ■譯名與敘詞的對應關係
  兩種語言的詞或詞組之間並不總是一一對應。
  ■譯名的排列
  雙語種對照索引按譯名的字順排列。一般採用逐詞字順排列法。

3.2.5 輪排索引的微觀結構

  ■收詞範圍
  輪排索引最好是將敘詞表的全部敘詞和非正式敘詞都予以編排;輪排索引也可以只收詞組敘詞,不收單詞素敘詞和非正式敘詞。
  ■輪排形式
  輪排索引可以選擇的輪排形式至少有三種:詞內輪排、詞外輪排、倒置輪排。其中,以詞內輪排形式採用較多。
  ■款目包含因素
  輪排索引的款目因素,除了被輪排的詞之外,可以或多或少地包含這些因素:詞在字順表中的位置、範疇號、參照項、外文譯名等。

3.3 敘詞表結構的變化

  敘詞表又逐歩向功能增強.結構簡明的方向發展。
具體表現爲:

  1. 字順表與詞族索引合併
  2. 範疇索引與詞族索引合併
  3. 字順表與專有敘詞表(附表)合併,許多詞表不設專有敘詞表。
  4. 以詳細的分類表(分面分類表或等級列舉式分類表)取代範疇索引和詞族索引,實現分類主題一體化

3.4 敘詞表的編制與維護

3.4.1 敘詞表的編制程序

  —般的編表程序爲:
  總體設計——>制定編制規範——>收集詞彙——>整理詞彙——>試標引

3.4.2 敘詞表的一般收詞原則

  1. 目標性原則
  2. 文獻保證原則
  3. 用戶保證原則
  4. 組配優先原則
  5. 基本詞彙完備和精煉原則
  6. 兼容性原則

3.4.3 敘詞表的修訂內容

  1. 增補語詞及詞間關係
  2. 刪除不必要的詞及詞間關係
  3. 修改款目詞及其著錄項目
  4. 微觀和宏觀結構的調整

3.4.5 計算機在敘詞表編制管理和使用中的應用

  1. 計算機在敘詞表編制過程的應用
  2. 計算機在敘詞表管理中的應用
  3. 機讀敘詞表在計算機網絡中的使用

4 參考資料

《信息組織(第三版)》,戴維民主編,高等教育出版社,2014年.  
《信息組織(第四章)》PPT

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章