算法面試彙總

阿里媽媽一面:

這是我遇見最難得面試,最難,最難,重要的說三遍;

  1. 自我介紹,這都是套路了,簡單介紹就好;
  2. 介紹比賽過程,怎麼做的比賽,然後隨機提問;
  3. 從Boosting到AdaBoost到GBDT到LightGBM介紹演變路線,各個模型到底是怎麼回事;
  4. 怎麼做的特徵工程,哪些特徵比較重要;
  5. 一定要做EDA和特徵工程嗎,這裏回答比較傳統,應該比較lightgbm和NN,NN的優勢就是避免了特徵工程;
  6. 不同的模型(主要分析lgb和NN)數據應該如何處理,有什麼不同的處理方式嗎,爲什麼會有不同;
  7. 比賽用的什麼指標,ROC,ROC是怎麼得來的,知道G-ROC嗎,ROC評價指標是否合理,有沒想過考慮其他的;
  8. NN怎麼來做這種任務,從MLP到DeepFM(簡單的思想);
  9. 怎麼避免過擬合,老生常談了,如何避免欠擬合,這裏簡單的整理了下,歡迎補充;
    在這裏插入圖片描述
  10. 問了一個概率題,我是很懵逼,一個骰子,隨機往桌子上扔,求扔多少次,每個面至少出現一次,扔的次數的平均值(十分爆炸),思路是從最少的次數到最大的次數,然後求各個次數每個面至少出現一次的概率,得到一個數列後,對這個數列進行求和,n趨向於無窮大求極限;從這裏基本就炸了;
  11. 有兩根不均勻分佈的香 香燒完的時間是一個小時,你能用什麼方法來確定一段15分鐘的時間;我當時沒想出來,非腦筋急轉彎;
  12. 介紹下高斯分佈和泊松分佈,以及泊松分佈和二項分佈的關係;
  13. 強化學習瞭解嗎,簡單介紹下;
  14. 能否將一個思想或者任務,擴展到多個方面,是個開放性問題,舉例子比如說強化學習除了常見的用在遊戲中,其他領域如何應用,考察理解的廣度;
  15. Leetcode Medium題56. Merge Intervals 當時忘了最優怎麼做了,非常尷尬,哎,表現最不好的地方吧。
  16. 關於特徵工程的一些討論,是否有必要;
  17. 你的興趣是什麼,以後想從事什麼工作,其實這個想問是否和他們的工作契合吧,我換了一種回答方式;
  18. 在小米的工作任務是啥,音樂分類,簡單介紹下如何實現音樂分類,兩種方法分別是什麼;
  19. 關於論文的一些討論,還有學校的一些事情;

華爲一面

  1. 自我介紹
  2. 介紹Quora比賽,具體是什麼,都做了哪些工作;
  3. AiChallenger都做了什麼,這個比賽是怎麼回事;
  4. Word2Vec、Glove、fasttext分別是什麼,如何得到的,相互比較;
  5. 如何得到句子向量,和詞向量的關係;
  6. 什麼時候開始學NLP,專業和導師是做什麼的,是否自學;
  7. attention機制是怎麼回事;
  8. RNN、LSTM等怎麼回事,有什麼缺陷;
  9. attention機制的softmax是怎麼做的;
  10. transformer是怎麼回事;
  11. 樣本不均衡如何來解決;
  12. 如何避免過擬合;
  13. 常用什麼語言,什麼框架;
  14. 神經網絡如何調參,煉丹的思想;
  15. 簡述貝葉斯調參;
  16. 在瀚思科技(第一家實習公司)的實習經歷,在小米的工作和任務;

騰訊一面

  1. 自我介紹
  2. 介紹自己的比賽經歷,詳細介紹科大訊飛的比賽過程;
  3. 比賽任務是什麼,都包括哪些特徵;
  4. 在小米的實習經歷,工作內容是什麼;
  5. GBDT和XGBoost分別是什麼回事,區別是什麼;
  6. XGBoost並行化是怎麼回事且是如何實現的;
  7. 提取了什麼特徵;
  8. 手機品牌的特徵如何進行分析的;
  9. stacking的原理是什麼;
  10. 開放性問題(這個問題問的最久),如何根絕王者榮耀玩家的歷史信息,對玩家進行道具和皮膚的推薦;
  11. 對於上述問題,如何推薦金幣卡和經驗卡,提取哪些特徵;
  12. 對於大規模稀疏數據如何處理,訓練一個模型還是多個模型;
  13. FM、FFM相關的簡單介紹;
  14. 介紹下Mapreduce和Hadoop相關的原理;
  15. Spark的某個函數如何使用;

騰訊二面:

  1. 簡單介紹,本科是哪,能什麼時候來實習;
  2. 問比賽和項目經驗,非常細,挑自己最熟悉的講;
  3. 從頭到位介紹了科大訊飛的比賽過程和比賽細節,一定足夠熟悉比賽過程;
  4. 特徵選擇的方法,嵌入法(lgb)Vs過濾法(卡方檢驗);
  5. 爲什麼這些特徵用lgb篩選,另一些特徵用卡方檢驗來篩選;
  6. 爲什麼用5折交叉;
  7. 模型融合,爲什麼融合,怎麼融合,何爲最優模型。這個地方討論了很多,要深刻理解模型訓練的實質,模型學習train,val,test的統計分佈。這裏我的回答非常不確定,應該和實際的工程相關,模型訓練的目標不是單純的比賽刷榜,而是提高泛化能力。
  8. 有沒有做數據預處理,如何做的;
  9. 和Top的差距在哪裏,後來有發現什麼提高模型的辦法嗎;
  10. Quora比賽,如何做的,模型的輸入是什麼,這個比賽最後選擇的方案是什麼;
  11. Aichallenger比賽,細粒度,粒度都是什麼,如何訓練的。比賽內容的介紹。文本長度,模型輸入是什麼等等;
  12. lightgbm爲什麼比xgboost快;
  13. 比賽分工是什麼;

參考資料

[1] https://www.nowcoder.com/discuss/143458
[2] https://zhuanlan.zhihu.com/p/59259010

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章