OLAP 和數據挖掘的關係

從技術角度看,商務智能的過程是企業的決策人員以企業中的數據倉庫爲基礎,經由數據挖掘工具、聯機分析處理工具加上決策規劃人員的專業知識,從數據中獲得有用的信息和知識,幫助企業獲取更多的利潤。
      數據倉庫是一個用以更好地支持企業或組織的決策分析處理的的數據集合,它有面向主題、集成、相對穩定、隨時間不斷變化四個特性,將數據倉庫與傳統的面向事務處理的數據庫區分開來。數據倉庫的關鍵技術包括數據的抽取、清洗、轉換、加載和維護技術。
    聯機分析處理(OLAP)是以海量數據爲基礎的複雜分析技術。 它支持各級管理決策人員從不同的角度、快速靈活地對數據倉庫中的數據進行復雜查詢和多維分析處理,並且能以直觀易懂的形式將查詢和分析結果展現給決策人員。OLAP使用的邏輯數據模型爲多維數據模型。常用的OLAP多維分析操作有上鑽、下鑽、切片、切塊、旋轉等。多維數據模型在物理實現時,主要有三種方式:ROLAP結構MOLAP結構HOLAP結構。其中ROLAP是基於關係數據庫的OLAP實現, MOLAP是基於多維數據組織的OLAP實現,HOLAP是基於混合數據組織的OLAP實現。 
  數據挖掘(Data Mining)是從海量數據中,提取隱含在其中的、人們事先不知道的但又可能有用的信息和知識的過程。數據挖掘的數據有多種來源,包括數據倉庫、數據庫或其他數據源。所有的數據都需要再次進行選擇,具體的選擇方式與任務相關。挖掘的結果需要進行評價才能最終成爲有用的信息,按照評價結果的不同,數據可能需要反饋到不同的階段,重新進行分析計算。數據挖掘的常用方法包括關聯分析、分類和預測、聚類、檢測離羣點、趨勢和演變分析等。可以說:聯機分析處理和數據挖掘是數據倉庫之上的增值技術。 
    在理論研究上,OLAP技術的研究人員主要來自數據庫界,重點研究CUBE壓縮與計算、實體化視圖的選擇與維護、多維數據的索引和多維查詢處理等技術,以便能夠在海量數據上提供秒級的分析請求響應時間。數據挖掘技術的研究人員來自人工智能、統計、數據庫界,其研究主要集中在各種挖掘算法和評價方法上,研究可伸縮的數據挖掘方法、基於約束的挖掘方法、複雜數據類型的挖掘等。
    聯機分析處理和數據挖掘雖然是數據倉庫上獲取兩種不同目標的數據增值技術,但這兩類技術如果能夠在一定程度上融合,會使分析操作智能化,使挖掘操作目標化,從而全面提升商務智能技術的實用價值。即:一方面,聯機分析技術可以爲數據挖掘提供預期的挖掘對象和目標,避免挖掘的盲目性。另一方面,數據挖掘技術可以使聯機分析處理智能化,減少分析人員手工操作的繁雜性,減輕分析人員的負擔。例如,當分析人員在手工分析操作中發現離羣點數據,可以有針對性地直接對此數據利用數據挖掘技術尋找原因,從中找出惡意違規或發現新的需求點。又如,在數據分析過程中,通過跟蹤分析人員的操作過程,利用數據挖掘技術預測他可能感興趣的操作和數據,提前預計算或預取數據,從而提高分析操作的響應時間。
    因此可以說,基於數據倉庫的聯機分析處理技術與數據挖掘技術的融合和互補,將是商務智能技術發展的未來走向。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章