OLAP與數據分析

說到數據分析,OLAP大概是BI廠家最常見的選擇。如果你看看國內BI廠家的宣傳資料,如果提及數據統計,OLAP應該是必談的話題。爲什麼OLAP會變成和數據分析幾乎同意的詞?二者是否真正的是幾乎等同?我們在這裏來做一個瞭解。

OLAP從字面上是指及時的數據分析。但實用中,OLAP更多的是指針對數據分析的一種解決方案。OLAP的軟件把數據預處理成數據立方。基本是把有可能的彙總都預先算出來。在用戶選擇顯示某種彙總時,OLAP可以在預先的計算出來的結果基礎上很快地計算出結果。從而可以很好地支持極大量數據的及時分析。

也就是說OLAP實際上包括了兩個方面。
第一,OLAP提供了一個互動的數據分析的模式。OLAP把數據分成維(dimension)和度量(measure)。用戶通過選擇dimensionmeasure,可以及時地計算數據在不同dimension的組合下的彙總。在這裏可能有一個誤區。其實OLAP本身並沒有定義一個用戶端的互動模式。比如大部分傳統的OLAP是通過一個交叉表的界面,但是新的界面更多的採取可視化的圖表形式。

第二點,可能是更本質的,是OLAP定義的一種對數據的處理方式。這包括了對數據預計算的思路和方式。在國內廠家裏,很少有自己開發OLAP後端數據處理的。在國外廠家中,有自己OLAP後端的有IBMMicrosoftOracle等。

作爲一個有着十幾年實際應用歷史的技術,OLAP是當之無愧的數據分析的元老。但在OLAP的應用中,用戶也遇到了很多問題。其中最爲關鍵的就是OLAP在靈活性上的缺陷。OLAP的使用要求用戶事先對數據有一個分析,把所有的dimensionmeasure都羅列出來。這樣OLAP處理器就可以把相關的值預先計算出來。

而由於數據立方需要很大的空間。它的大小是以指數增長的。所以在設計OLAP的時候,用戶又必須把dimension的數量限制在一個相對比較小的範圍。在實際應用時,用戶只能在這個預先選擇好的dimension之內來進行分析。如果用戶需要從不同的角度來看這些數據,這個OLAP就必須重新設計和生成。

近年來,BI領域出現了幾項大的技術革新,在很大程度上彌補了OLAP的不足。在前端的顯示上,數據分析更多地採用了可視化的模式。這裏並不是簡單地指通過圖表來顯示OLAP的結果。新的可視化數據分析工具在通過圖表對數據進行顯示的基礎上,實現了一個完整的互動模式,讓用戶可以任意的通過不同的角度和方法對數據進行檢驗。

在後端的處理上,以列爲主導的數據庫結構,及雲計算的概念,使及時分析可以不再依靠預計算就可以處理極大的數據量。這樣既解決了大數據的運算,也避免了OLAP所帶來的不靈活的問題。

StyleScope是一個綜合了可視化理論,和以列爲主的雲計算的數據處理結構,達到了一個完美的結合。用戶不再需要面對複雜的OLAP系統,可以十分快捷地創建起一個強大的數據分析系統。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章