通過我自己的這大半年的接觸和了解,結合找工作需要現對於如何入門機器學習提幾點自己的看法。如果你以後要想幹算法工程師、機器學習工程師,數據挖掘工程師。那麼請你好好看一下我下面說的話。
============================================================================
總路線
先學機器學習,再學深度學習(實驗室某大神學長的建議),至少精通深度學習的一個方向:CV和NLP。期間要插科打諢地複習好數據結構、數學基礎和強化你的編程能力。
---------------------------------------------------------------------------------------------------------------------------
數學功底:概率論、線性代數、高數、信息論(主要是信息熵那部分)。
數據結構:樹、棧、鏈表、隊列、圖!慢慢琢磨吧。(要有優化算法複雜度的意識)
編程能力:請轉移到leetcode、賽碼陣營好好磨練。《劍指offer》這本書是需要你好好看的。
----------------------------------------------------------------------------------------------------------------------------------
書籍的話:《統計學習方法》(李航)、《機器學習》西瓜書、《深度學習》(Yoshua Bengio & Ian GoodFellow)、《PRML》(選看)、《利用python進行數據分析》
吳恩達的深度學習,機器學習課程,一些其他機器學習課程都可以看。在這裏,推薦一下中國海洋大學 黃海廣 博士牽頭的將吳恩達視頻做成的中文版學習筆記:機器學習和深度學習。我自己還沒有看,不清楚質量如何,但是應該比較省事了。有錢的話,推薦優達學城,不過貴,不免費。深度學習的工具tensorflow和pytorch,可以買本書看,學會看官方文檔,這兩個工具掌握一個就好。可以通過打比賽(天池、京東、騰訊、kaggle等),做項目,進一步強化自己的動手能力。
大數據的話要會,要了解並行化分佈式的東西,比如hadoop,spark,Hive等,要明白底層的工作原理。
機器學習主要模型:線性迴歸,邏輯迴歸,svm,各種樹模型。原理公式要會,會推導。(如果你要走機器學習崗的工作),現在算法崗對深度學習用處多一些。
經典算法:EM,HMM,貝葉斯網絡,樸素貝葉斯,聚類,PCA,LDA,高斯混合模型。
概率論相關:各種分佈,極大似然,最大後驗,假設檢驗的過程(顯著性水平和p的區別和聯繫),卡方檢驗等等。
---------------------
版權聲明:本文爲CSDN博主「_Amsterdam」的原創文章,遵循CC 4.0 by-sa版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/qq_34554003/article/details/80367344