結構化數據、半結構化數據和非結構化數據

在實際應用中,我們會遇到各式各樣的數據庫如nosql非關係數據庫(memcached,redis,mangodb),RDBMS關係數據庫(oracle,mysql等),還有一些其它的數據庫如hbase,在這些數據庫中,又會出現結構化數據,非結構化數據,半結構化數據,下面列出各種數據類型:

結構化數據:
能夠用數據或統一的結構加以表示,我們稱之爲結構化數據,如數字、符號。傳統的關係數據模型、行數據,存儲於數據庫,可用二維表結構表示。

半結構化數據:
所謂半結構化數據,就是介於完全結構化數據(如關係型數據庫、面向對象數據庫中的數據)和完全無結構的數據(如聲音、圖像文件等)之間的數據,XML、HTML文檔就屬於半結構化數據。它一般是自描述的,數據的結構和內容混在一起,沒有明顯的區分。

非結構化數據:
非結構化數據庫是指其字段長度可變,並且每個字段的記錄又可以由可重複或不可重複的子字段構成的數據庫,用它不僅可以處理結構化數據(如數字、符號等信息)而且更適合處理非結構化數據(全文文本、圖象、聲音、影視、超媒體等信息)。
非結構化數據,包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類報表、圖像和音頻/視頻信息等等
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章