機器學習筆記(一)——機器學習基礎

1. 何謂機器學習

機器學習就是把無序的數據轉換成有用的信息。

機器學習的主要任務是分類,另一項任務是迴歸。

 

監督學習:之所以稱之爲監督學習,是因爲這類算法必須知道預測什麼,即目標變量的分類信息。(分類、迴歸)

無監督學習:數據沒有類別信息,也不會給定目標值。(聚類、密度估計)

 

監督學習:

  k-鄰近算法、線性迴歸、樸素貝葉斯算法、局部加權線性迴歸、支持向量機、Ridge迴歸、決策樹、Lasso最小回歸係數估計

 

無監督學習:

  K-均值、最大期望算法、DBSCANParzcn窗設計

 

2. 如何選擇合適的算法

考慮兩個問題:一、使用機器學習算法的目的,想要算法完成何種任務;二、需要分析或收集的數據是什麼。

 

3. 開發機器學習應用程序的步驟

(1)收集數據

(2)準備輸入數據

(3)分析輸入數據

(4)訓練算法

(5)測試算法

(6)使用算法

 

4. Python

一、安裝Python(安裝在Windows系統中)

下載地址:https://www.python.org/downloads/windows/

選擇版本:Python2.7.9, win32 版本


二、安裝NumPySciPy

下載地址:http://www.scipy.org/scipylib/download.html

點擊紅色框框位置,進入下載頁面,選擇對應的版本下載安裝(numpy-1.9.2-win32-superpack-python2.7.exe、scipy-0.15.1-win32-superpack-python2.7.exe)

    


三、安裝Matplotlib

下載地址:http://matplotlib.org/downloads.html

安裝版本:matplotlib-1.4.3.win32-py2.7.exe

import matplotlib會出現下面的錯誤:

     

matplotlib需要依靠 six、dateutil 和 pyparsing 模塊, 退出python模式,返回cmd命令模式, 分別輸入命令:

pip install six

easy_install python_dateutil

easy_install pyparsing

安裝這三個模塊。

安裝好six、dateutil 和 dateutil之後可以成功import matplotlib了。


四、Ubuntu中安裝NumpySciPy和Matplotlib

Ubuntu已經自帶Python2.7,所以現在只需安裝Numpy、SciPy和Matplotlib,安裝也很簡單,依次輸入下面三個命令即可安裝:

sudo apt-get install python-scipy
sudo apt-get install python-numpy
sudo apt-get install python-matplotlib


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章