列舉數據挖掘領域的十大挑戰問題

數據挖掘(Data Mining,DM)又稱數據庫中的知識發現(Knowledge Discover in Database,KDD),是目前人工智能和數據庫領域研究的熱點問題,所謂數據挖掘是指從數據庫的大量數據中揭示出隱含的、先前未知的並有潛在價值的信息的非平凡過程。數據挖掘是一種決策支持過程,它主要基於人工智能、機器學習、模式識別、統計學、數據庫、可視化技術等,高度自動化地分析企業的數據,做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調整市場策略,減少風險,做出正確的決策。

知識發現過程由以下三個階段組成:(1)數據準備,(2)數據挖掘,(3)結果表達和解釋。

數據挖掘是通過分析每個數據,從大量數據中尋找其規律的技術,主要有數據準備、規律尋找和規律表示3個步驟。數據準備是從相關的數據源中選取所需的數據並整合成用於數據挖掘的數據集;規律尋找是用某種方法將數據集所含的規律找出來;規律表示是儘可能以用戶可理解的方式(如可視化)將找出的規律表示出來。


數據挖掘領域10大挑戰性問題:

1.Developing a Unifying Theory of Data Mining ( 數據挖掘的統一理論框架的構建)

2.Scaling Up for High Dimensional Data/High Speed Streams (高維數據和高速數據流的挖掘)

3.Mining Sequence Data and Time Series Data (序列和時序數據的挖掘)

4.Mining Complex Knowledge from Complex Data (複雜數據中複雜知識的挖掘)

5.Data Mining in a Network Setting (網絡環境中的數據挖掘)

6.Distributed Data Mining and Mining Multi-agent Data (分佈式數據和多代理數據的挖掘)

7.Data Mining for Biological and Environmental Problems (生物和環境數據的挖掘)

8.Data-Mining-Process Related Problems ( 數據挖掘過程中的相關問題處理)

9.Security, Privacy and Data Integrity (數據挖掘中數據安全、數據所涉及到的隱私和數據完整性的維護)

10.Dealing with Non-static, Unbalanced and Cost-sensitive Data (非靜態、非平衡及成本敏感數據的挖掘)


鏈接:http://www.cnblogs.com/janemores/archive/2013/04/26/3045962.html


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章