多媒體數據挖掘系統架構

 

一、挖掘內容

多媒體數據:多維的,非結構化或者半結構化的數據

多媒體數據庫:數據量大,數據結構複雜,模式多樣

細分領域:圖像挖掘、視頻挖掘、音頻挖掘、web挖掘、多媒體綜合挖掘

二、挖掘定義

   多媒體數據挖掘:多媒體信息處理技術和數據挖掘技術結合,綜合分析視聽特性和語義,發現隱含的、有效的、可理解的模式,得出時間的趨向和關聯

三、多媒體數據挖掘系統模型

1、多媒體數據庫

     元數據:對媒體對象信息和內容的解釋

2、數據預處理器

識別和糾正或消除衝突、不完整數據以及組合數據庫所共有的不兼容性

數據清理:填寫缺失值、光滑噪聲數據、識別刪除離羣點,消除髒數據

數據集成:將來自不同數據源的的數據整合成一致的數據存儲,元數據、相關分析、數據衝突檢測和語義異構性的解決在於此步驟

數據變換:將數據庫中的原始數據轉換成適合數據挖掘的數據形式,

數據歸約:用數據立方體聚集,屬性子集選擇、維度歸約、數值歸約和離散化得到數據的歸約表示,降低信息內容的損失。

3、挖掘引擎

   一組算法:分類、聚類、關聯規則、趨勢分析

4、數據挖掘界面

四、多媒體數據挖掘的方法

  1、數據立方體

       一般是多維的,

      通過上卷、下鑽、切片和切塊、旋轉進行強有力的分析

  2、聚類算法

      無監督學習

  3、分類算法

       監督學習

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章