數據挖掘工具深度測評

數據挖掘應用程序可幫助發現大量數據之間的聯繫,典型應用就是“雜貨店的顧客購買模式”。如今這個信息時代,合適的數據挖掘工具能幫助企業贏在起跑線上。

1

1、FineBI

FineBI最新的版本主打的是超大數據量性能和自助式分析2個特點,最高可以支撐20億數據的秒級呈現,在功能方面跟Tableau很接近,適用於企業中的技術人員、業務人員和數據分析師,可以完全自主的進行探索式分析,軟件在易用性和功能上做的都很不錯。

FineBI在內置的數據挖掘算法方面相對比較豐富一些,除了預測和聚類之外,還支持分類、迴歸、關聯規則一共五大數據挖掘模型算法。

2、IBM Cognos Analytics

IBM Cognos Analytics 既適用於部門級的業務人員,也適用於業務人員 + IT 部門這種目前比較流行的搭配組合。業務人員也可快速的製作儀表盤,比如使用雲詞圖和主狀態,並且通過 Data Player(數據參數播放器)進行播放式的多維數據分析。同時,也可以製作 Story(故事),特別是在彙報和總結工作的時候比較實用,通過數據來講故事,總結分析。

只是,目前國內有關 IBM Cognos Analytics 的相關介紹還比較少,學習資料大多是英文,學習成本較高。

3、R

R作爲一種統計分析軟件,是自由軟件,是完全免費,開放源代碼的,可以實現許多統計功能。R作爲一個開放的統計編程環境,我們可以自由地編制函數來擴展現有的語言。所以,它的更新速度比一般統計軟件,如,SPSS,SAS等快得多。這也是其程序包繁多並且更新迅速的原因之一。

但R語言跟SPSS一樣,並不適合毫無統計知識的初學者使用。

4、Tableau

Tableau提供了一系列專注於商業智能的交互式數據可視化產品。Tableau允許通過將數據轉化爲視覺上吸引人的交互式可視化(稱爲儀表板)來實現數據的洞察與分析。

在挖掘語言集成方面,Tableau目前除了支持R語言之外,還支持與Python語言的集成。

5、SPSS

從數據挖掘工具的角度來說,SPSS在統計分析領域有更高一籌的優勢,既可以很好地進行迴歸分析、方差分析以及多變量分析等,又能在計算分析的同時輸出圖形,極高地提升工作效率。Excel 表格數據、文本格式數據均可以導入,節省了相當大的工作量。

但它要求使用者懂統計學,理解一些分析模型;功能性弱於R,在數據可視化方面過於單調,較爲成熟的數據分析師甚至會直接跳過SPSS,選取可視化更強的分析工具。

6、Pentaho

Pentaho BI平臺不同於傳統的BI產品,它是一個以流程爲中心的,面向解決方案(Solution)的框架。其目的在於將一系列企業級BI產品、開源軟件、API等等組件集成起來,方便商務智能應用的開發。

它側重於大中型企業應用。

7、KNIME

KNIME這款數據分析平臺,數據和工具的集成能力不錯,容易與第三方的大數據框架集成其通過大數據組件的擴展(Big Data Extension)能夠方便的和Apache的Hadoop和Spark等大數據框架集成在一起,非常的容易使用。

它兼容多種數據形式,也能與第三方的機器學習庫集成使用,比如H2O,Keras,Scikit-Learn等提供基於Web報告或者數據視圖的展示支持動態工作流的設計。

8、Weka

Weka是一個應用了機器學習算法來進行數據挖掘的框架,其算法不但可以直接應用於數據集,還能用Java代碼直接調用。其提供了很多的工具用於數據的預處理、分類、迴歸等以及最後的可視化,典型的應用場景爲,比如物聯網。

正如KNIME一樣,WeKa和Hadoop,Spark也能無縫的集成。和R相比,Weka在統計分析方面較弱,但在機器學習方面要強得多。

 

與任何軟件一樣,數據挖掘解決方案需要選擇適合自己。例如,如果您正在評估來自企業供應商SAS的數據挖掘工具,那麼是否擁有相應技術的數據分析師?如果想要讓普通業務員都能做數據挖掘,那麼FineBI等易上手的工具更適合你。

原文鏈接:http://www.finebi.com/2019/datamining

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章