推薦:Orange 容易安裝、圖形界面輸出、功能強大
Orange 是一個基於組件的數據挖掘和機器學習軟件套裝,它的功能即友好,又很強大,快速而又多功能的可視化編程前端,以便瀏覽數據分析和可視化,基綁定了 Python以進行腳本開發。它包含了完整的一系列的組件以進行數據預處理,並提供了數據帳目,過渡,建模,模式評估和勘探的功能。其由C++ 和 Python開發,它的圖形庫是由跨平臺的Qt框架開發。
KNIME:Win7 64位安裝後啓動後卡死,文檔較少,不建議使用
KNIME (Konstanz
Information Miner) 是一個用戶友好,智能的,並有豐演的開源的數據集成,數據處理,數據分析和數據勘探平臺。它給了用戶有能力以可視化的方式創建數據流或數據通道,可選擇性地運行一些或全部的分析步驟,並以後面研究結果,模型 以及 可交互的視圖。 KNIME 由Java寫成,其基於 Eclipse 並通過插件的方式來提供更多的功能。通過以插件的文件,用戶可以爲文件,圖片,和時間序列加入處理模塊,並可以集成到其它各種各樣的開源項目中,比如:R 語言,Weka, Chemistry Development
Kit, 和 LibSVM.
RapidMiner
Weka
由Java開發的 Weka (Waikato
Environment for Knowledge Analysis) 是一個知名機器學機軟件,其支持幾種經典的數據挖掘任務,顯著的數據預處理,集羣,分類,迴歸,虛擬化,以及功能選擇。其技術基於假設數據是以一種單個文件或關聯的,在那裏,每個數據點都被許多屬性標註。 Weka 使用Java的數據庫鏈接能力可以訪問SQL數據庫,並可以處理一個數據庫的查詢結果。它主要的用戶接品是Explorer,也同樣支持相同功能的命令行,或是一種基於組件的知識流接口。
JHepWork
爲科學家,工程師和學生所設計的 jHepWork 是一個免費的開源數據分析框架,其主要是用開源庫來創建一個數據分析環境,並提供了豐富的用戶接口,以此來和那些收費的的軟件競爭。它主要是爲了科學計算用的二維和三維的製圖,幷包含了用Java實現的數學科學庫,隨機數,和其它的數據挖掘算法。
jHepWork 是基於一個高級的編程語言 Jython,當然,Java代碼同樣可以用來調用 jHepWork 的數學和圖形庫。