信息組織 | 歷史發展與未來趨向

1 我國古代的信息組織及其特點

古代信息組織活動處於初始階段,呈現出以下特徵:

  1. 以信息的揭示、存儲爲基本目的;
  2. 最早形式的目錄和藏書組織的着眼點不在於"用 “而在於"管”
  3. 信息組織對象主要是文獻;
  4. 信息揭示、組織的方法主要是對信息的記錄和分類, 着重信息外在特徵的記錄和描述,體現爲清冊職能;
  5. 操作完全由個人以手工方式進行,簡單且無一定標準 和規範;
  6. 信息組織的代表性成果是目錄。

2 近代國外信息組織及其特點

  1. 近代信息組織的活動除圍繞着文獻的保存開展外,開始重視對信息外在特徵和內容特徵的全面描述、揭示。
  2. 體系分類法的確立。
  3. 主題法的研究和應用。確立了主題法原則,而且有了完整的主題 詞表和達到一定水平的主題揭示活動。
  4. 索引、文摘的發展說明信息組織從載體單元到內涵單元的深化。
  5. 信息組織技術方法的進步。分類法與主題法的編制技術更趨科學 、完善。

3 分類法的改造、主題法的發展、分類主題一體化、自然語言

3.1 分類法的改造

  1. 1906年,英國的布朗(J.D.Brown )在《主題分類法》中採用了 主題分析法和組合原則,成爲分面分類法的萌芽。
  2. 1933年,印度圖書館學家阮岡納贊(S.R.Ranganathan )編制了世界上第一部分面組配式分類法——《冒號分類法》,並系統 提出了分面分類理論。在其影響下,一系列專業分面類表問世。 傳統分類法被不斷地增加分面組配成分,朝分面組配方向改造。

3.2 主題法的發展

  1. 1947—1950年間,美國的穆爾斯(C.N.Mooers )在研究組配分類法 的基礎上,提出了一種新型主題法一敘詞法,並創造了 “敘詞”、“敘詞法”, “情報檢索”,"情報檢索系統"等專門術語。
  2. 20世紀60年代,敘詞語言吸收了標題法、單元詞法、關鍵詞法以及分類法等各種檢索語言之長,逐步取代了元詞法成爲現代情報檢索語言的主流。它以概念組配取代字面組配,並廣泛揭示概念間關係,使文 獻信息的揭示更加準確。
  3. 1959年美國杜邦公司編制了第一部敘詞表。
  4. 20世紀70年代,我國開始大規模編制和使用主題法。1971年,航空部情報所編制使用的《航空科技資料主題表》第2版問世,成爲我國的第一部敘詞表。1979年岀版的《漢語主題詞表》,成爲世界上最大規模的敘詞表。

3.3 分類主題一體化

  1. 1969年,英國學者艾奇遜(J.Aitchison )編制了世 界上第一部分類主題一體化的《分面敘詞表》O o它將一部分面分類表與一部字順敘詞表結合起來,通過嚴格規範,使每一個詞彙同時出現在分類 表與敘詞表中,實現了兩種檢索語言的兼容。
  2. 在其影響下,英美等國陸續出版了一批分類主題 —體化詞表,如《倫敦教育分類法(第二版)》 、《建築工業敘詞表》、《基礎敘詞表》等。

3.4 自然語言檢索系統的探索和應用

  1. 20世紀50年代,盧恩(H.P.Luhn)在前人探索的基礎上 ,將計算機用於關鍵詞索引的編制。其後,各種直接以自然語言爲標識的檢索系統相繼出現。
  2. 20世紀60年代初,美國匹茲堡大學健康法律中心率先建立起第一個全文檢索系統一一LEXISO

4 網絡信息資源組織

4.1 傳統分類法和主題法網絡適用性研究

  USMARC—體化編目格式中特設了856字段,即電子地址及檢索方式字段,通過它可實現書目記錄與網絡信息 資源的鏈接。
  國際上幾部著名的分類法如UDC , DDC , LCC , CLC等 都在謀求網絡上的應用,並已取得相當進展。
  主題法組織網絡信息有着比分類法更突出的優勢,一些 傳統的敘詞表被改造成聯機敘詞表,還有的將敘詞表嵌 入數據庫檢索系統,充當檢索系統的後控詞表。
  繼分類法和主題法等傳統工具之後,本體、主題地圖、 專家系統等新型知識組織工具陸續出現,分類法、主題 法的網絡化、本體化改造成爲新的研究熱點。

4.2 搜索引擎技術的發展

  1. 獨立型搜索引擎
  2. 混合式搜索引擎
      混合式搜索引擎:兼具檢索型和目錄型兩種檢索方式。
  3. 元搜索引擎
      又稱爲多線程式搜索引擎,是指利用統一的檢索界面, 實現對多個獨立搜索引擎索引數據庫進行檢索,並將檢 索結果以統一格式顯示的網絡檢索工具。
  4. 分佈式搜索引擎
      分佈式搜索引擎是根據地域、主題、IP地址及其它的劃 分標準將全網分成若干個自治區域,在每個自治區域內設立一個檢索服務器,而每個檢索服務器由信息搜索機器人,索引搜索軟件數據庫和代理三部分組成。各個代理之間可以進行查詢的重定向。

4.3 元數據的開發應用

  1. 元數據在網絡中起着對信息的描述,定位,管理作用。
  2. 都柏林核心元數據集(Dublin Core , DC)是影響最大.使 用最爲廣泛元數據體系,現已成爲解決互操作問題的元數據標準。
  3. 衆多元數據方案在實際運用中出現的元數據間的有效共享與互操作成爲關注的課題。

4.4 語義網、本體研究

1998年,伯納斯李提出了 "語義網"概念並在其後設計了 語義網的多層架構。

語義網研究成爲熱點,研究內容包括:知識的表現(如 XML )、知識之間關係的描述(如RDF )、機器可識別的 信息的集合(如Ontology)、智能體(Agents )等。 本體(Ontology)是語義網的關鍵技術,有關本體構建工具,本體表示語言,本體構建方法,本體應用等硏究成爲熱點。

語義網的瓶頸在本體,本體構建的瓶頸在於領域知識庫的構建。

■傳統知識組織工具(分類法、主題詞表)是本體構建的基 礎或是改造源,是一條捷徑,兼容改造傳統的敘詞表、分 類表,研發知識本體、語義網絡、主題圖等語義工具成爲 網絡知識組織工具研發的方向。
■改造方法:
用XML Schema構建敘詞標記語言,用RDFSchema表示敘詞內容 和關係,用SKOS、DML+OIL. OWL表示敘詞關係等。

5 現代信息組織的特點

  1. 信息組織的出發點充分考慮用戶的需要和檢索習慣。
  2. 多元化的信息資源組織。
    信息組織對象由單純的印刷型文獻發展磁帶、光盤、數據庫、網絡等 多媒體,信息組織內容更加廣泛,從各種類型的數據發展到具有豐富內容的知識,形成了信息組織方式的多樣性和多層次性。
  3. 檢索語言的發展。
    分面分類理論的提出,突破了傳統列舉式分類法的束縛,爲信息組織方法提供了新的思路。
    自動標引技術和分類、主題法在網絡環境下的應用受到廣泛關注。自然語言的研究和應用興起。
  4. 現代信息技術的應用。
    信息組織形式從數據結構發展到知識表示;信息以文件方式、數據庫方式、主題樹方式和超媒體方式組織。
    網絡信息資源的組織成爲信息組織實踐與理論研究的熱點。
    元數據技術、語義網本體技術、搜索引擎技術、數據庫技術、信息挖 掘、推送技術等成爲信息組織領域內倍受關注的課題。

6 信息組織的發展趨勢

  1. 以用戶需求爲導向的信息組織
  2. 信息內容揭示深入化
  3. 信息組織方法集成化
  4. 信息組織技術智能化
  5. 信息組織系統兼容化與標準化
  6. 信息組織理論研究的拓展
  7. 積極應對大數據時代信息組織的挑戰

參考資料

《信息組織》第三版 戴維民主編,高等教育出版社,2014年
《信息組織》第十章 PPT

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章