BI與大數據之間的差距有哪些

  BI(Business Intelligence),中文翻譯是商務智能,是一套完整的解決方案,用來將組織中現有的數據進行有效的整合,快速準確的提供報表並提出決策依據,幫助組織做出明智的業務經營決策。

BI與大數據之間的差距有哪些

 

  商業智能能夠輔助的業務經營決策,既可以是操作層的,也可以是戰術層和戰略層的決策。爲了將數據轉化爲知識,需要利用數據倉庫、聯機分析處理(OLAP)工具和數據挖掘等技術。商業智能的關鍵是從許多來自不同的企業運作系統的數據中提取出有用的數據並進行清理,以保證數據的正確性,然後經過抽取(Extraction)、轉換(Transformation)和裝載(Load),即ETL過程,合併到一個企業級的數據倉庫裏,從而得到企業數據的一個全局視圖,在此基礎上利用合適的查詢和分析工具、數據挖掘工具、OLAP工具等對其進行分析和處理(這時信息變爲輔助決策的知識),最後將知識呈現給管理者,爲管理者的決策過程提供數據支持。

 

  大數據(Big Data)是從收集的海量數據中,通過算法將這些來自不同渠道、格式的數據進行直接分析,從中尋找到數據之間的相關性。簡單而言,大數據更偏重於發現,以及猜測並印證的循環逼近過程。

 

  從技術上看,大數據與雲計算的關係就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單臺的計算機進行處理,必須採用分佈式架構。它的特色在於對海量數據進行分佈式數據挖掘。但它必須依託雲計算的分佈式處理、分佈式數據庫和雲存儲、虛擬化技術。

 

  大數據需要特殊的技術,以有效地處理大量的容忍經過時間內的數據。適用於大數據的技術,包括大規模並行處理(MPP)數據庫、數據挖掘電網、分佈式文件系統、分佈式數據庫、雲計算平臺、互聯網和可擴展的存儲系統。

 

  不管定義如何不同,大數據與傳統BI是社會發展到不同階段的產物,我們從幾下幾個緯度來可以迅速的看出兩者的區別:

 

  一、從數據來源角度

 

  大數據應用的數據來源,不僅僅包括非結構化的數據,還有各種系統數據,數據庫數據。其中非結構化數據主要是集中在互聯網以及一些社交網站上的數據以及一些機器設備的數據,這些都構成了大數據應用的數據來源。對於大數據的分析工具來說,現階段也是對於非結構化的數據分析的比較多。

 

  BI系統則是在數據集成方面的技術越來越成熟,對於數據的提取,一個各種數據挖掘的要求來說,數據集成平臺會幫助企業實現數據的流通和交互使用,在企業內部實施BI應用就是爲了可以更好的對數據進行分享和使用。

 

  二、從發展方向角度

 

  BI的發展要從傳統的商務智能模式開始轉換,對於企業來說,BI不僅僅是一個IT項目,更是一種管理和思維的方式,從技術的部署到業務的流程規劃,BI迎來新的發展。對於大數據來說,現階段更多的大數據關注在非結構化數據,不同的數據分析工具的出現和行內的應用範圍不斷的加大,對於大數據應用來說,怎麼與應用的行業進行一個深層次的結合纔是最重要的

 

  三、從人員的角度

 

  傳統BI只要掌握核心的SQL技術就可以從事BI的工作,而大數據的數據處理,涉及太多新的技術,不同的應用場景需要不同的大數據處理方法了,而且不再有人機交互那麼好的客戶端了,至少要懂流處理、HADOOP、列式或分佈式鍵值數據庫吧,還需要能在SPARK上開發算法程序,對於用戶畫像、產品標籤化、推薦系統、排序算法都應有所理解。

 

  因此,大數據相對於傳統BI,不是簡單的PLUS的關係,它涉及了思想、工具和人員深層次的變革。

 

  大數據對於傳統BI,既有繼承,也有發展,BI比大數據更傾向於決策,對事實描述更多是基於羣體共性,幫助決策者掌握宏觀統計趨勢,適合經營運指標支撐類問題,大數據則內涵更廣,傾向於刻畫個體,更多的在於個性化的決策。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章