機器學習初探

       在阿里半年多的時間裏,從一個機器學習門外漢終於進入到門裏面了。下面給大家講講現在工業上整個機器學習流程和一些自己的體會。

學習過程:

        1.   理解機器學習的一些基礎概念,像auc,梯度.... 大家參考《機器學習》 周志華。

        2.  從基礎看起,先學習基礎模型,lr模型,gbdt模型,fm模型,ffm模型,現在有很多開源的代碼,最好是c++的,並用公開的數據集進行訓練,深入理解數學公式的每個細節,多看,多跑。如果有機會,最好你們公司內部有一個很好的項目,你能參與進去,從頭到尾搞一下還是不錯的,你會發現會受益匪淺,這也是自己,還有包括阿里其他同學寫模型的一致感受,條件不夠的話,可以先從單機版開始。

        3. 把以上基礎都打結實了,就可以學習深度模型了,也就是業界所說的dnn,核心概念主要網絡,這個大家基礎學習可以看《深度學習》經典數據。

       4. 基於分佈式的可以參考開源代碼庫ps-lite,具體細節就看你的悟性。

 感悟:

         其實寫模型還是比較簡單的,其實最核心還是數據,數據,數據,數據的理解。

         做機器學習首先必須補充一些基礎數學知識,其次不要害怕,工業界的實現的算法都很簡單,正所謂仁者見仁,智者見智。共勉哇,大家加油。。。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章