計算機科學基礎_11 - 智能

機器學習&人工智能

  • 分類
  • 分類器
  • 特徵
  • 標記數據
  • 決策邊界
  • 混淆矩陣
  • 未標籤數據
  • 決策樹
  • 支持向量機
  • 人工神經網絡
  • 弱AI,窄AI
  • 強AI
  • 強化學習

計算機很擅長存放,整理,獲取和處理大量數據。很合適有上百萬商品的電商網站,或是存幾十億條健康記錄,方便查看。

但如果想根據數據做決定呢?
這是機器學習的本質(根據數據做決定)。機器學習算法讓計算機可以從數據中學習,然後自行作出預測和決定。
能自我學習的程序很有用,比如判斷是不是垃圾郵件。人是否有心律失常嗎?下一個視頻該推薦哪個?等等。雖然有用,但不會說它有人類一般的智能。雖然AI和ML這兩詞經常混着用,大多數計算機科學家會說,機器學習是爲了實現人工智能這個更宏大目標的技術之一,人工智能簡稱AI。

機器學習和人工智能算法一般都很複雜,說一說概念。

分類器

例如:判斷飛蛾是“月娥”還是“帝娥”,這叫“分類”。
做分類的算法叫“分類器”,雖然用照片和聲音來訓練算法,很多算法會減少複雜性,把數據簡化成“特徵”,“特徵”是用來幫助“分類”的值。

標記數據和決策邊界

對於飛蛾分類的例子,用兩個特徵:“翼展”和“重量”,爲了訓練“分類器”作出好的預測,需要“訓練數據”,爲了得到數據,需要收集相應相關合適量的數據。收集過程中,需要記錄數據,並且不只記錄特徵值,還會把種類記錄上,這叫“標記數據”,因爲只有兩個特徵,很容易用散點圖把數據視覺化。能夠大致分成倆組,但還是會有一定的重疊,需要機器學習算法,找出最佳區分,通過數值估量,翼展小於45毫米的,很可能是帝娥,再加上一個條件,重量必須小於0.75,纔算是帝娥。這些叫做“決策邊界”。

混淆矩陣

一定數量的帝娥在正確的區域,但剩下的幾隻,在錯誤的區域,另一方面,一定數量的月娥在正確的區域,剩下的在錯誤的區域。這個表,記錄正確數和錯誤數,這表叫“混淆矩陣”。

---------------------------
| 正確區域帝娥 | 錯誤區域帝娥 |
|-------------------------|
| 錯誤區域月娥 | 正確區域月娥 |
---------------------------

機器學習算法的目的,是最大化正確分類 + 最小化錯誤分類

未標籤數據

用決策邊界,如果是一隻不認識的飛蛾,可以測量它的特徵,並繪製到決策空間上,這叫“未標籤數據”。
決策邊界可以猜測飛蛾的種類。

決策樹

這個把決策空間,切成幾個盒子的簡單方法,可以用“決策樹”來表示。

圖像與if語句:

clipboard.png

生成決策樹的機器學習算法,需要選擇用什麼特徵來分類,每個特徵用什麼值。
有時候一些算法甚至用多個“決策樹”來預測,計算機科學家叫這個“森林”,因爲有多棵樹。

支持向量機

本質上使用任意線來切分“決策空間”,不一定是直線,可以是多項式或其他數學函數。機器學習算法負責,找出最好的線,最準確的決策邊界。

只有兩個特徵比較好實現,但如果加第三個特徵,比如“觸角長度”,那麼2D線段,會變成3D平面。在三個唯獨上做決策邊界,這些平面不必是直的,而且 真正有用的分類器會有很多飛蛾種類。

三個特徵和五個品種,可以用3D散點圖 實現:

clipboard.png

如果是一次性有4個或更多個特徵,就容易實現,沒有好的方法,更別說成百上千的特徵了。這正是機器學習面臨的問題。

通過想象在一個上千緯度的決策空間裏,給超平面找出一個方程。是不可行的,但機器學習算法可以做到。

人工神經網絡

“決策樹”和“支持向量機”這些都出至於統計學,統計學早在計算機出現前,就在用數據做決定,有一大類機器學習算法用了統計學,也有不使用統計學的。其中值得注意的是 人工神經網絡,靈感來自大腦裏的神經元。神經元是細胞,用電信號和化學信號,來處理和傳輸消息,它從其他細胞得到一個或多個輸入,然後處理信號併發出信號,形成巨大的互聯網絡,能處理複雜的信息。

人造神經元很類似,可以接受多個輸入,然後整合併發出一個信號,它不用電信號或化學信號。而是吃數字進去,吐數字出來,它們被放成一層層,形成神經元網絡,因此得名神經網絡。

clipboard.png

飛蛾例子,看如何用神經網絡分類:

  • 第一層,輸入層,提供需要被分類的單個飛蛾數據,同樣,也用重量和翼展。
  • 另一邊是輸出層,有兩個神經元:一個是月娥,一個是帝娥。2個神經元裏最興奮的,就是分類結果。
  • 中間有一個隱藏層,負責把輸入變成輸出,負責幹分類這個重活。

clipboard.png

抽取一個“隱藏層”裏第一個神經元,神經元做的第一件事是把每個輸入乘以一個權重。

clipboard.png

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章