一、挖掘內容
多媒體數據:多維的,非結構化或者半結構化的數據
多媒體數據庫:數據量大,數據結構複雜,模式多樣
細分領域:圖像挖掘、視頻挖掘、音頻挖掘、web挖掘、多媒體綜合挖掘
二、挖掘定義
多媒體數據挖掘:多媒體信息處理技術和數據挖掘技術結合,綜合分析視聽特性和語義,發現隱含的、有效的、可理解的模式,得出時間的趨向和關聯
三、多媒體數據挖掘系統模型
1、多媒體數據庫
元數據:對媒體對象信息和內容的解釋
2、數據預處理器
識別和糾正或消除衝突、不完整數據以及組合數據庫所共有的不兼容性
數據清理:填寫缺失值、光滑噪聲數據、識別刪除離羣點,消除髒數據
數據集成:將來自不同數據源的的數據整合成一致的數據存儲,元數據、相關分析、數據衝突檢測和語義異構性的解決在於此步驟
數據變換:將數據庫中的原始數據轉換成適合數據挖掘的數據形式,
數據歸約:用數據立方體聚集,屬性子集選擇、維度歸約、數值歸約和離散化得到數據的歸約表示,降低信息內容的損失。
3、挖掘引擎
一組算法:分類、聚類、關聯規則、趨勢分析
4、數據挖掘界面
四、多媒體數據挖掘的方法
1、數據立方體
一般是多維的,
通過上卷、下鑽、切片和切塊、旋轉進行強有力的分析
2、聚類算法
無監督學習
3、分類算法
監督學習