AI算法工程師-從入門到上癮

設定一個非常清晰的目標

清晰的目標就比如說你要做NLP,你要知道NLP的應用有智能問答,機器翻譯,搜索引擎等等。然後如果你要做智能問答你要知道現在最發達的技術是深度學習,使用的算法有RNN/LSTM/Seq2Seq/等等一系列。而我的清晰目標是在實習的時候給我的任務。當任務很明確的時候,所需要的語言就明確了,所要學習的算法也就明確了,很多東西就順理成章了不用一頭亂撞了。

機器學習是人工智能的一種,深度學習是機器學習的一種。學AI先學機器學習。

在這裏插入圖片描述
理論知識對於AI算法工程師極其重要。敲代碼只是思路的一個實現過程。這裏的“算法”和計算機CS的“算法”還不太一樣,AI算法是偏數學推導的,所以數學底子還是需要點的,學的越深,要求越高。面試的時候,很少讓手寫代碼,90%都是在問模型摳算法細節

按照數據集有沒有Y值可以將機器學習分爲監督學習、半監督學習和無監督學習。監督學習是分類算法,無監督學習是聚類算法。
在這裏插入圖片描述

機器學習如何入門

機器學習的三大塊:傳統的機器學習ML、圖像處理CV、自然語言處理NLP
首先推薦一個入門神器:

ML入門該參加的賽題(Titanic)
在這裏插入圖片描述
圖像入門該參加的賽題(數字識別)
在這裏插入圖片描述
NLP入門該參加的賽題(情感分析、quora問句語義匹配)
在這裏插入圖片描述
在這裏插入圖片描述

自學如何尋找學習資料?

1、Kaggle(www.kaggle.com

這是一個世界級的最權威的機器學習比賽,已被谷歌收購。賽題覆蓋傳統機器學習、nlp、圖像處理等,而且都是很實際的問題,來自各行各業。kaggle是數一數二完善的ML社區了,賽題開放的數據集就很有用,非常適合新手練手。對優秀的kaggler也提供工作機會。
上面的賽題不僅很有代表性,還有很多免費的優秀的數據集供你使用,要知道收集數據是機器學習的第一大難題,它就幫你解決了。入門不用立馬參加比賽,把數據下載下來,盡情折騰就好了,要是沒有思路,去網上搜別人的解題筆記和代碼借鑑一下也很美好~因爲這是大家都爭相打榜的比賽,所以你並不孤單。

2、github(www.github.com

3、StackOverFlow(www.stackoverflow.com

代碼報錯找它,代碼不會敲找它!所有與代碼相關的坑,基本都有人踩過啦

4、csdn(www.csdn.net

最接地氣的博客聚集地,最常看的網頁之一,一般用來搜索細節知識點或者代碼報錯時

5、sklearn(scikit-learn.org/stable)

專業做機器學習100年!各算法各技巧的例子code應有盡有

6、medium(medium.com

創辦人是Twitter的創始人,推崇優質內容,國內很多AI公衆大號的搬運都來自於這裏,medium裏每個作者都有自己獨特的見解,值得學習和開拓眼界,需要科學上網

7、towards data science(towardsdatascience.com

與medium很像,需要科學上網

8、google AI blog(ai.googleblog.com

谷歌的AI團隊維護的博客,每天至少更新一篇技術博客。剛在上海開的谷歌開發者大會宣佈將會免費開放機器學習課程,值得關注一下,畢竟是AI巨頭

有口碑的AI公開課平臺

  • coursera(www.coursera.org/browse)

  • 吳恩達(Andrew Ng)機器學習

  • deeplearning.aiwww.deeplearning.ai

  • fast.aiwww.fast.ai

    專注於深度學習。Fast.ai的創始人就蠻有意思的,是橫掃kaggle圖像處理的高手,不擺架子,也不故弄玄虛。中心思想就是深度學習很簡單,不要怕。fast.ai有博客和社區。Jeremy和Rachel鼓勵撰寫博客,構建項目,在會議中進行討論等活動,以實力來代替傳統證書的證明作用。

  • udacity(in.udacity.com

    有中文版,課程覆蓋編程基礎,機器學習,深度學習等。

  • 網易雲課堂

實用的小技巧

瀏覽器首推 chrome
搜索問題一定用google,如果沒解決是你的問題不是google的鍋

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章