機器學習實習生面試總結(阿里 騰訊等)

今年來一直在找暑期實習,現在基本已經確定了,前後歷經差不多2個月吧,發現了很多自己的缺點,同時也希望寫出來供需要的人蔘考了解


先說下我自己的情況吧,決定去騰訊TEG的機器學習崗實習了,面試期間(3月初-4月底)投了不少公司的暑期實習(都是機器學習崗),大概有這麼多吧(按照投的時間順序):

  • 完美世界(筆試掛)
  • 美團(offer)
  • 阿里螞蟻金服(offer)
  • 騰訊TEG(offer)
  • 滴滴研究院(offer)
  • 去哪兒(offer)
  • 360(筆試掛)
  • 商湯科技(一面掛)
  • 華爲(offer)
  • 網易有道(筆試通過,面試要去北京我沒去)

百度沒投,它時間很晚(4月底筆試,5月初面試),然後我就沒投了

每家的情況都說下吧:
(1) 完美世界筆試掛,投的太早完全沒複習果然gg了
(2) 美團內推沒有筆試(非官網投遞),不過實驗室的其它人都沒獲得面試機會(看臉??),一面就直接過了(做機器學習圖像的),面試官還是很nice的,直接發offer了
(3) 阿里就很坑了,3面技術面+HR面(更優秀的還有交叉面),然而我並沒有,三面面的不好,問了我一堆java源碼的,我沒答上來,到現在我還沒有拿到offer,一直是面試中,估計也沒什麼戲,時間真的持續了好久;有意思的是,一面的面試官說今年ML崗太火,他們傾向於博士。。。。也是醉了
(4) 騰訊現場面的,兩面+HR面,每一面都刷很多人,一面去的時候人山人海,二面就很少人了,HR面去的時候只有我一個,我差點以爲我走錯片場了。。。結果過了,TEG網絡部的機器學習崗
(5) 滴滴研究院,也是非官網投的,兩面+HR,問的比較深,感覺滴滴研究院這幫做算法的水平很不錯,之後順利通過,大數據策略組的機器學習實習生
(6) 去哪兒也是現場面的,一個下午就面完直接口頭髮的offer,效率很高,兩面+HR,一面是個小弟面的基礎,二面HR後來告訴我是數據組的老大面的項目,順利過了
(7) 360不知道怎麼回事,筆試做的感覺還可以,3個編程題AC了兩個然後也沒過,聽說招實習很少
(8) 商湯科技也是內推的,過了筆試,一面是香港打來的,問的非常深,只問deep learning,其它不問,面了50分鐘吧,gg了
(8) 華爲暫時還沒面,因爲我拿了華爲編程比賽的獎,所以免了筆試,不過筆試也不難
(9) 網易有道投的是java開發,聽說筆試掛了無數人,然而我沒掛,後來讓去北京總部去面,報銷路費,我決定再三還是沒去,放棄了,因爲實習不想去java開發(那麼爲什麼我當時投java開發???)

其實還有微軟,不過那編程題實在是做不出來,ACM編程題,有興趣的去感受下hihoder微軟2017預科生,另外告訴一點,即使是PM也是要做這個題的。。。


給我的感觸還是很多,總結如下:

(1) 早準備,我就是去年冬天在外地出差幹活沒複習,今年來做筆試的時候就很吃虧
(2) 好好刷leetcode,基本在線面試的筆試題都是leetcode的題
(3) 實習經驗非常重要,有實習做過相關項目的話很加分
(4) 瞭解的廣不如瞭解的深,最好要在某個領域鑽研的比較有心得(比如推薦,用戶畫像,目標檢測等),因爲面試官會順着你的簡歷一直往下問,比如你做了用戶畫像,他就會問你怎麼做的?如何做的特徵工程?特徵如何選擇?balabala…
(5) 想去阿里的一定要java玩的溜,尤其源代碼, jvm,集合框架這是一定會問的
(6) 雖然說搞ML的集中在算法方面,但是最好還是要會Hadoop,Spark之類的,畢竟你算法需要數據,數據只能你自己去拉(滴滴和阿里面試官原話)
(7)ML競爭很激烈,做好心理準備


5月6號更新
(1)阿里的螞蟻金服offer已經拿到
(2)分享面試的具體問題

  • 什麼是boosting tree
  • GBDT
  • L1和L2正則爲何可以減弱over-fitting?
  • L1和L2正則有什麼區別
  • KNN和LR有什麼本質區別
  • 怎麼理解Dropout
  • 爲什麼random forest具有特徵選擇的功能
  • random forest有哪些重要的參數?
  • DNN爲什麼功能強大,說說你的理解
  • SVM的損失函數是什麼?怎麼理解
  • 介紹下Maxout
  • 項目中over-fitting了,你怎麼辦
  • 詳細說一個你知道的優化算法(Adam等)
  • 項目(比賽)怎麼做的模型的ensemble
  • stacking是什麼?需要注意哪些問題
  • 瞭解哪些online learning的算法
  • 如何解決樣本不均衡的問題
  • fasterRCNN中的ROIPooling是如何實現的
  • 如何進行特徵的選擇
  • 如何進行模型的選擇
  • 什麼是梯度消失?怎麼解決
  • 常用的有哪些損失函數
  • XX用戶畫像挖掘怎麼做的feature engineering?
  • 假設一個5*5的filter與圖像卷積,如何降低計算量?
  • 做過模型壓縮嗎?介紹下
  • 什麼是residual learning?說說你的理解
  • residual learning所說的residual和GBDT中的residual有什麼區別?
  • FFM和FTRL有過了解嗎?
  • 你對現在Deep Learning的發展和遇到的問題有什麼看法?

基本這些就是我問的問題,不是一家公司,其它的問題還有,主要看你的簡歷和項目,這個每個人不一樣


5月19號更新
阿里大牛推薦了幾本書(非基礎類),雖然以前也知道可是沒看過,大牛推薦了還是要看的,分享給大家:
(1) Machine Learning A Probabilistic Perspective
(2) The Elements of Statictical Learning

我自己推薦Bengio的”Deep Learning”一書


基本就是這些了,僅供大家參考

發佈了105 篇原創文章 · 獲贊 123 · 訪問量 58萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章