視頻地址:https://www.bilibili.com/video/av50747658/?p=1
1-3 Supervised Learning 監督學習
P1 Regression Problem 迴歸問題
視頻中介紹了一個經典的例子:關於房價的預測。
圖中橫軸是房子的大小,縱軸是房子的價格。通過監督學習訓練出一個函數對應房子的大小和價格,從而對房價進行預測。
簡單來說,迴歸問題就是給出n個sample包含具體的值作爲訓練集,然後根據測試集的屬性值來對具體值進行預測。
P2 Classification Problem 分類問題
經典例子,腫瘤惡性良性的判斷。
橫軸是腫瘤的尺寸大小,縱軸是是否爲惡性。根據腫瘤的大小來對惡性和兩性腫瘤分類
分類問題就是給出一些包含正確分類的sample對模型進行訓練,然後根據sample的屬性對樣本進行分類。
總的來說,監督學習的訓練數據集需要給出每個訓練樣本的具體值或具體分類,相當於要給出“正確答案”。
而實際問題會比上述例子中複雜的多,例如上面所說的分類良性與惡性腫瘤的問題,只是一個一元問題,每個樣本只包含腫瘤大小這一個屬性,而在真實的問題中可能包含很多屬性。
例如圖中這樣,已列舉出圖中五個屬性。
這是一道簡單的選擇題。
答案是第三個,很明顯問題一是要預測具體的值,所以爲是迴歸問題,問題二是要講賬戶分類所以是分類問題。
1-4 Unsupervised Learning 無監督學習
對比監督學習,無監督學習有很大的不同。
例如:
監督學習是有標籤的,在訓練集中每一個樣本有所謂的正確答案。
而無監督學習的數據集僅僅是隻有數據,沒有具體的分類或其他標籤。將這些數據交給程序,程序能夠自動的分析得到數據的結構。
無監督學習應用非常廣泛,當無法對具體問題結果進行認爲細分的時候,就可以用無監督學習來解決問題。
例如:
Organize computing clusters
用來管理大型計算機集羣,分類哪些計算機趨向於協同工作,並將其組織起來。
Social network analysis
社交網絡分析,分類某個社交平臺上的用戶羣體所在的圈子。
Market segmentation
市場劃分,分類客戶羣體屬於哪幾類銷售市場。
Astronomical data analysis
分析星系如何形成(這個我暫時還不太理解)。
推薦使用的開發工具:octave 內置很多現成的函數方法,可以快速的構建機器學習算法模型。
例如:雞尾酒算法。
一些人在一個雞尾酒宴會上,環境音很嘈雜,這時利用一個麥克風對某一個人說的話進行錄音,錄音結果人聲和嘈雜的環境音疊加在一起,利用雞尾酒算法可以將這些重疊的聲音分開,利用Octave只需要一行代碼,得益於它的內置函數。
以上是第一講三四節的內容。