AI入門指南

筆者公衆號:技術雜學鋪

筆者網站:mwhitelab.com

最近筆者身邊越來越多,無論是不是計算機專業的人,都開始接觸人工智能了。

筆者有一年多的AI自學經驗,學過幾門課程、看過幾本書、參加過一些比賽項目,在這裏做一個AI入門大全,希望可以解決萌新不知從何入門的難題。

1. 學什麼?機器學習還是深度學習

筆者曾在何爲AI中,介紹了人工智能,機器學習和深度學習的區別。

人工智能、機器學習、深度學習的邏輯關係圖

總的來說,機器學習是人工智能的一種實現方法,深度學習是機器學習的一個分支。

不過當我們平時談及機器學習和深度學習的時候,我們常常用機器學習指傳統的統計學習方法,而深度學習指使用神經網絡的方法。

1.1 機器學習

機器學習是用統計學的方法,來實現數據預測、分類等問題。

常見的使用場景有:商品推薦,個人信用評估,量化金融,醫療、交通領域大數據等等

常用的算法有:線性迴歸,SVM,樸素貝葉斯,決策樹,模型集成等等。

經典機器學習算法表

機器學習很數學,很統計學。當你學習樸素貝葉斯、SVM這樣的機器學習經典算法的時候就會理解數學的重要性。

除此之外,機器學習還需要有對數據有很強的敏感度。尤其是當你參加和機器學習有關的比賽和項目的時候,在做清洗數據、特徵工程的時候,對數據的分析尤爲重要。

有一句流傳很廣的話:數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已。可見對數據敏感是很重要的能力。

1.2 深度學習

深度學習是用神經網絡的方法,來解決計算機視覺,自然語言處理等問題。

常見的使用場景有:人臉識別,文本識別,文本翻譯,語音轉文本,客服機器人等等。

最基本的模型分類有:CNN,RNN等。

目前大部分萌新都是從深度學習開始入門。讀者若是不知從機器學習還是深度學習學起的話,筆者建議先學深度學習。

在Coursera上可以找到大量AI課程

深度學習需要數據量遠遠大於傳統的機器學習,常常是用來解決視覺或語言方面的問題

除此了用統計學和神經網絡這兩個主流的人工智能實現方法,還有強化學習。不過這對新人來說直接入門過難,還是不要考慮了。

至於要從機器學習還是深度學習開始入門,就要看個人的需求了。

2. 機器學習入門指南

機器學習主流語言爲python/R/matlab。常用的python庫有pandas,sklearn和matplotlib。

2.1 機器學習算法入門

視頻可看吳恩達的machine learning課程

筆者當時是看書籍入門的。推薦《統計學習方法》、《機器學習實戰》、《機器學習》(俗稱西瓜書)。

耐心看完《統計學習方法》和《機器學習實戰》前80%的部分就可以開始比賽了。

2.2 機器學習實戰建議

記住,學會算法和應用算法是兩回事!

在學習算法時我們會學習線性迴歸,SVM,決策樹等等。但真正做項目的時候,我們面對的問題會複雜很多。

也許數據有殘缺,有錯誤,我們需要清洗數據(使用pandas)

獲得了合格的數據後,我們需要查看數據的分佈(使用matplotlib等繪圖工具),做特徵工程,提取特徵。

獲得了特徵後,我們可以應用機器學習算法了(使用sklearn機器學習算法庫)

sklearn機器學習庫

應用算法後,我們還需要評估我們的算法效果如何,要用到準確率、召回率、F1等等指標。同時還要考慮模型有沒有過擬合。

在獲得了模型的各類指標後,我們需要不斷調整模型,提高模型的效果。可能會需要模型集成、重新篩選特徵……

這一系列步驟需要大量的實戰練習,僅僅知道幾個經典的機器學習算法是遠遠不夠的。推薦去kaggle阿里天池上做些和數據挖掘的比賽。

3. 深度學習入門指南

深度學習目前主流爲python,主流框架爲tensorflow和pytorch。

視頻課程推薦吳恩達的DeepLearning課程,課程內容十分詳細。五門大課,從基礎知識、卷積網絡、RNN網絡、項目實現等多個角度,循序漸進講解深度學習入門的方方面面,同時有配套的練習代碼。

網易和其有合作,在網易雲課堂上有中文字幕的視頻。英語不好的同學可以直接在這裏上學習就行了。

吳恩達的Deeplearning課程

DeepLearning課程資料

深度學習進階內容

《深度學習》和其作者之一 Ian Goodfellow

學習完後可根據個人的需求,選擇指定領域深入學習。

書目建議購買《深度學習》,俗稱花書。(電子版: 
 英文原版 | 中文版 )

同時,建議讀者逛一逛kaggle阿里天池,做些與深度學習相關的比賽。

4. 學習建議

4.1 網上兩千塊的人工智能專業課值得學嗎?

曾有朋友向我吐槽,目前人工智能最大的賺錢項目就是開付費課程教其他人人工智能。

的確,網絡上以某雲課堂和某學城爲代表的平臺提供的人工智能專業課,宣稱爲專業從業人士指導,往屆學員多數入職大公司。至於課程價格,則在2000+。

某平臺的高額付費課程

筆者認爲,買這類課程完全沒必要!

網絡上免費的優質課程質量並不差。筆者自學數月後,看其付費課程所提供的教學大綱,感覺自己可以講授絕大部分內容。

至於付費課程宣傳的一起做實戰項目,讀者平時逛逛kaggle和阿里天池,實戰項目不愁做。

還有那宣傳的“便捷的在線項目實戰平臺”,完全就是在線的jupyter,讀者按着筆者以前寫過的python環境安裝教程,就可以在自己電腦上配置一個運行環境。

4.2 作爲學生,AI入門差不多了該做什麼

可去 kaggle阿里天池上做一下新手比賽,如kaggle上的Titanic(機器學習)或者Digit Recognizer(深度學習)。在暑假的時候歡迎報名Deecamp

kaggle比賽網站

若參加了一些比賽且實力不錯,可以直接向今日頭條等公司投遞實習簡歷。在假期的時候在AI公司實習兩個月,無論是對實力還是以後的出路,都是很有幫助的。

4.3 學會了可以做什麼?

機器學習可以在金融公司、保險公司等充滿數據且數據信息很複雜的領域做數據挖掘,即找出數據之間潛在的有價值的關係。

而深度學習則可進入相關領域的大公司或創業公司,從事圖像識別、自然語言處理等領域的問題。

各大公司都開始推出自己的AI服務

4.4 學習資料大全

更多學習資料可見:人工智能學習清單

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章