1. 何謂機器學習
機器學習就是把無序的數據轉換成有用的信息。
機器學習的主要任務是分類,另一項任務是迴歸。
監督學習:之所以稱之爲監督學習,是因爲這類算法必須知道預測什麼,即目標變量的分類信息。(分類、迴歸)
無監督學習:數據沒有類別信息,也不會給定目標值。(聚類、密度估計)
監督學習:
k-鄰近算法、線性迴歸、樸素貝葉斯算法、局部加權線性迴歸、支持向量機、Ridge迴歸、決策樹、Lasso最小回歸係數估計
無監督學習:
K-均值、最大期望算法、DBSCAN、Parzcn窗設計
2. 如何選擇合適的算法
考慮兩個問題:一、使用機器學習算法的目的,想要算法完成何種任務;二、需要分析或收集的數據是什麼。
3. 開發機器學習應用程序的步驟
(1)收集數據
(2)準備輸入數據
(3)分析輸入數據
(4)訓練算法
(5)測試算法
(6)使用算法
4. Python
一、安裝Python(安裝在Windows系統中)
下載地址:https://www.python.org/downloads/windows/
選擇版本:Python2.7.9, win32 版本
二、安裝NumPy和SciPy
下載地址:http://www.scipy.org/scipylib/download.html
點擊紅色框框位置,進入下載頁面,選擇對應的版本下載安裝(numpy-1.9.2-win32-superpack-python2.7.exe、scipy-0.15.1-win32-superpack-python2.7.exe)
三、安裝Matplotlib
下載地址:http://matplotlib.org/downloads.html
安裝版本:matplotlib-1.4.3.win32-py2.7.exe
import matplotlib會出現下面的錯誤:
matplotlib需要依靠 six、dateutil 和 pyparsing 模塊, 退出python模式,返回cmd命令模式, 分別輸入命令:
pip install six
easy_install python_dateutil
easy_install pyparsing
安裝這三個模塊。
安裝好six、dateutil 和 dateutil之後可以成功import matplotlib了。
四、Ubuntu中安裝Numpy、SciPy和Matplotlib
Ubuntu已經自帶Python2.7,所以現在只需安裝Numpy、SciPy和Matplotlib,安裝也很簡單,依次輸入下面三個命令即可安裝:
sudo apt-get install python-scipy
sudo apt-get install python-numpy
sudo apt-get install python-matplotlib