機器學習怎麼學【1】Hello ML

人工智能與機器學習

機器學習與最近很熱的人工智能基本上屬於同一個範疇,人工智能是機器學習的一個高大上的名字,而機器學習則是實現人工智能的一個技術手段。例如,人臉識別,自動駕駛等人工智能時代熱門的項目都是由機器學習實現的。

可以說,掌握了機器學習的方法,就相當於掌握了人工智能時代最核心的內涵。

事實上,機器學習發展了這麼多年,不論是理論上還是實際生活中的應用中,都可以有其獨有的作用。機器學習也已經在每個現代人生活中有及其重要的作用。

例如,我學機器學習時,最長舉的例子就是垃圾郵件識別。垃圾郵件識別是機器學習中最經典的案例,通過查看郵件內的詞頻就可以初步瞭解一封郵件是否爲垃圾郵件。

再比如,機器學習中最常用的另一個案例:鳶尾花數據集。通過分析一朵花的花瓣長度寬度,花萼長度寬度,就可以區分不同品類的鳶尾花。

機器學習可以幫助人們依據一些數據預測出一個案例的可能品類或者某屬性的可能值,由於一些屬性人們很難獲取到,這種預測技術顯得十分重要。

例如:是否可以通過某個糖尿病患者的一些體檢指標來預測一個糖尿病患者患諸如失明等糖尿病併發症的概率,並且提前對這類的患者進行特定疾病的預防?

機器學習的種類

機器學習依據不同的目的有不同的實現方法,因而分爲不同的類別。對於初學者來說,機器學習可以按照兩種思路進行分類

  • 按照數據差別:分爲監督學習與無監督學習
  • 按照所解決的問題:分爲分類問題與迴歸問題

監督學習與無監督學習

舉例說明,監督學習就好比教一個小孩水果分類,給小孩一個個具體案例,並告訴他這是蘋果,這是香蕉,這是梨。等小孩遇到一個新的案例時,就會認識一個新的水果是蘋果,香蕉還是梨。

監督學習的特點是對於有標籤的數據進行學習與建模,這是監督學習區別於無監督學習的最大特點。

還是剛纔的例子,如果我們不告訴小孩每個水果都是什麼水果,小孩還能區分不同水果麼?

答案是有可能,畢竟水果的區別是真實存在的,小孩如果足夠聰明自然能發現水果與水果之間的差異,並自發給水果分類。這就是無監督學習的特點,學習的數據並沒有標籤,因此只可以以來數據的特徵進行分類。

分類問題與迴歸問題

分類問題所面對的情形大體都爲,希望通過機器學習所得模型預測一個實例的種類,而回歸問題則是希望通過機器學習所得模型預測一個實例某一屬性的具體值。

例如:通過小紅週五吃的晚飯內容,來預測小紅週六穿的衣服的顏色,顏色是類別變量,因此這個問題屬於分類問題。
通過小紅的身高來預測小紅的體重,這裏的體重是數值型變量,因此這個問題屬於迴歸問題。

機器學習能做什麼

機器學習的確是一個很好用的工具,但是我們應該清楚,機器學習並不是無所不能的,甚至於機器學習在分辨垃圾郵件這件看似簡單的工作中也並不是那麼盡善盡美。

是的,機器學習是會犯錯誤的,這很正常,畢竟人也是要犯錯誤的。不過通過一些巧妙的方法,機器學習可以把錯誤率降低到很小,許多學者甚至可以將某個機器學習模型某個特定的場景下的錯誤率降低到10%以內。天下沒有白送的午餐,一個模型也不可能打遍天下無敵手。

另一種情況下,機器學習表現得很糟糕也並不是機器學習的問題。例如剛剛我舉了一個預測小紅週六出門穿的衣服的顏色例子,我舉例時說要用週五晚上小紅吃的東西來預測其週六出門穿的衣服顏色。從常理來說,吃什麼和穿什麼沒有絕對聯繫,然而在機器學習方法中這兩者可能有數據上的聯繫,因而機器學習也有可能得到準確的預測。

這很玄學,至今也無人能弄清楚。想找到某一個問題的最佳模型也常常不是一件容易的事情,這涉及到諸多方面。例如,數據的處理,模型的選取與參數的選擇。

但是情況也沒有過於糟糕,下一篇博客將爲你展示機器學習模型在經典案例中的精彩表現,你可以嘗試實現它們,相信這次嘗試會給你帶來探索機器學習更深層次使用的自信。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章