【信息檢索】【02檢索語言】【01檢索語言概述】

檢索語言/情報語言/文獻語言

實質:用於表達一系列概括文獻信息內容的概念及其相互關係概念標識系統
可用於對文獻內容進行主題標引、特徵描述或邏輯分類

檢索語言的組成(詞彙和語法)

檢索語言由詞彙和語法組成。
詞彙: 是登錄在類表、詞表中的全部標識。一個標識(分類號、檢索詞、代碼)就是它的語詞,而分類表、詞表就是它的詞典
語法:如何創造和運用那些標識來正確表達信息內容和信息需要,以有效實現信息檢索
的一整套規則。

💚檢索語言(廣義、狹義)

作爲溝通信息標引與信息檢索兩個過程而編制的人工語言。
retrieval language
廣義:泛指信息檢索過程中涉及人工語言和自然語言
狹義:指根據信息檢索的需要,按照一定的規則,對自然語言進行規範,並專門用於信息標引和用戶檢索的人工語言。

  • 人工語言:是根據一定的規則人爲編制而成的檢索語言,可用於表述文獻主要的內容,建立信息檢索系統
  • 自然語言:是人類交流時使用的語言,不受任何限制,未經加工和規範,更符合
    用戶的日常表達習慣

與其他語言相比,檢索語言突出的特點是

  • 保證不同的標引人員描述信息特徵的一致性
  • 保證檢索提問標識與信息特徵標識的一致性

檢索語言的特點
①具有必要的語義和語法規則,能準確地表達科學技術領域中的人和標引和提問的中心內容和主題;
②具有表達概念的唯一性,即同一概念不允許有多重表達方式,不能模棱兩可;
③具有檢索標識和提問特徵,進行比較和識別的方便性;
④既適用於手工檢索系統,也適用於計算機檢索系統

🧡檢索語言的功能/性能

  • 標引信息內容特徵及某些外表特徵,保證不同標引人員表達信息的一致性
    信息標引是一個羣體行爲,只有共同,依據檢索語言,才能保證標引信息的一致性。
  • 對內容相同及相關的文獻信息加以集中或揭示其相關性
    採用等級結構,參照系統,輪排聚類法,範疇聚類法等顯示概念之間關係的方法,來實現此功能。
  • 使信息的存儲集中化、系統化、組織化、便於檢索人員按照一定的排列次序 進行有序化檢索
    排列信息標識的方法包括:分類排列法、字順排列法、分類/字順排列法
  • 便於將標引用語和檢索用語進行相符性比較

🧡檢索語言的分類

按描述文獻特徵

分爲描述文獻外表特徵的檢索語言和描述文獻內容特徵的檢索語言
(1)描述文獻外表特徵的檢索語言
題名索引,著者索引,報告號索引、合同號索引、存取號索引,引文索引。
(2)描述文獻內容特徵的檢索語言
分類語言(體系分類語言、組配分類語言)
主題語言(標題詞索引、關鍵詞索引、單元詞索引、敘詞索引)
代碼語言(分子式索引、結構式索引、專利號索引)

按結構或原理

分類語言、主題語言、代碼語言和引文語言
(1)分類語言(體系、組配)
分類號來表達各種概念,各種概念按各學科性質分類、編排

  • 等級體系分類語言(體系分類法)
  • 分析—綜合分類語言(組配分類法)

(2)主題語言(標題法,單元詞,敘詞法,關鍵詞)
表達某一事物或概念的名詞術語,用於標引,存儲,檢索的一種檢索語言。
(3)代碼語言(就事物的某一方面特徵,用某種代碼系統來加以標引和排列。)
(4)引文語言(利用文獻之間的相互引證關係而建立的一種自然語言,其標引詞來自文獻的主要著錄項目)

按信息標識的組合使用方法(先組式、後組式和散組式)

(1)先組式語言(體系分類法和標題詞法)
信息主題概念的標識在編制詞表時就已固定組配好。

優點:標識明確,系統性較好,適用於傳統的文獻單元方式的目錄索引
缺點:表達專指概念和新概念較困難,靈活性較差,易造成詞表體積龐大,檢索途徑少。
(2)後組式語言(敘詞和單元詞)
指在詞表編制和標引信息時不規定表達主題標識的組配關係,在檢索時再根據需要將
各個標識進行組配,來表達較爲複雜的主題概念

優點:

  • 能夠以較少的詞語來表達較多的概念和較爲專指的概念,可以比較及時地表達新概念,概念容納能力強。
  • 可以實現概念的多向成族,多途徑檢索,能夠靈活地擴大和縮小檢索範圍
  • 因爲其檢索靈活性好。採用後組式語言所編制的詞表體積相對較小。

缺點:

  • 編制和使用的難度較大
  • 組配語義的明確性較差。

(3)散組式語言(冒號分類法)
是指對於複雜的主題標識,在詞表中不組配,而是在標引階段將表達主題概念的若干
個標識,根據一定的的規則組配在一起的檢索語言。

如果檢索標識能夠分段輪排,散組式語言就兼有先組式和後組式語言的主要優點。
如果檢索標識不輪排,性能和先組式語言差不多,只是其專指概念和新概念表達能力有所增強。

語言的規範程度(人工和自然)

人工語言有主題法(標題詞、單元詞、敘詞、關鍵詞)
分類法(體系分類法、組配分類法)
某些代碼等種類
自然語言 直接取自文獻信息本身,不經加工或規範的詞語或句子。

包括的學科或專業範圍(綜合性、專業性和多學科)

按所用語言文字(單語種、多語種)

檢索語言的理論基礎

🧡檢索語言與概念邏輯、知識分類和術語學的關係

  • 檢索語言的主要理論基礎有概念邏輯、知識分類、術語學
  • 檢索語言以概念邏輯爲基礎,知識分類是概念邏輯的基礎
  • 檢索語言的創制以術語學的研究成果爲基礎。

檢索語言是由概念標識系統組成的,而概念是由術語來表達的,是分類表、詞表的基本組成要素,檢索語言其實就是一個經過精細組織的術語集。

💚概念邏輯

是一種科學思維方法,通過明確各自概念及其相互關係而揭示事物的本質屬性及各
種事物之間的聯繫與區別。

檢索語言是表達一系列概括信息內容的概念及其相互關係概念標識系統。是建立在概念邏輯的基礎上。

概念的含義

是反映對象本質屬性的思維形式,是對事物本質屬性的概括
(1)概念的內涵是概念所反映的對象的本質屬性的總和。
(2)概念的外延是概念所反映對象的範圍。
(3)它們之間存在反變關係。 “被定義的概念(種概念)= 種差(與其它屬概念的本質的 差別) + 鄰近屬概念(包含被定義者的最小的屬概念)

概念間的關係

外延有相同部分:相容關係
外延無相重合部分:不相容關係

相容關係(同一、屬種、交叉、整體與部分、全面與某一方面、不相排斥的並列)

(1)同一關係 外延相同而內涵不同(同義詞、學名與俗名、同一產品正式命名與簡寫)
(2)屬種關係 外延呈包含於被包含 屬種是相對的→等級關係
(3)交叉關係 部分外延相重合 內涵爲交叉內涵之和,新概念爲下位概念。
(4)整體與部分 隸屬關係 上位下位
(5)全面與某一方面關係 全部問題,某一方面的問題 上位、下位
(6)不相排斥的並列關係 同屬概念下,兩個以上同級種概念的交叉關係

不相容關係(相互排斥的並列、矛盾、對立)

(1)互相排斥的並列關係
同屬概念下,兩個以上外延完全不同的種概念之間的關係
(3)矛盾關係
外延完全不同,其外延總和等於其上位概念全部外延的概念之間的關係
(3)對立關係
是指外延完全不同,其外延總和小於其上位概念全部外延的概念之間的關係

概念邏輯方法

概念的劃分與概括(分類)概念等級體系 體系分類法
原理

  • 用概念內涵由反映事物本質屬性的概念因素構成
  • 概念因素的增加或減少可以形成新的概念
  • 概念內涵與外延成反變關係等性質
  • 對概念進行劃分(縮小)或概括(擴大),形成更爲專指或更爲泛指的新概念

概念的分析與綜合(組配)概念組配體系 敘詞語言與組配分類法
外延相同部分可以形成一個新概念,其內涵等於原來兩個概念內涵之和

💚知識分類

實質(劃分知識單元、組織知識體系)
類型 (學科分類、事物分類)

  • 學科分類 以學科屬性爲分類標準
  • 事物分類 根據事物屬性的異同將事物劃分成類,構成事物分類體系
  • 學科分類是知識分類的主題,事實分類是知識分類的基礎。

基本原則 (客觀性和發展性)
(1)客觀性
即對學科或事物進行劃分和組織時,應依 據知識對象固有的、客觀存在的區別和聯繫。
(2)發展性
指知識分類的應按照學科或事物的發展規律,將知識對象由低級到高級,由簡單到復
雜進行劃分和組織。

知識分類在檢索語言中的意義

(1)檢索語言要能適合實踐應用和科學研究的需要,除了依據概念邏輯的理論基礎外,還須利用知識分類的成果,把各種概念之間的關係建立在知識分類的基礎上。
(2)如果說概念邏輯是檢索語言的基礎,那知識分類就是概念邏輯的基礎。
(3)檢索語言反映當代知識分類的程度是其質量的重要標誌之一。只有較充分反映知識分類的檢索語言,才能保證檢索語言在信息檢索工作中得到有效運用,並達到較好的效果。

💚術語學

術語是在特定學科領域用來表示概念的稱謂的集合。通過語音/文字表達或限定科學概念的約定性語言符號
研究概念、概念定義和概念命名基本規律的學科即術語學。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章