一面(大約1個小時):
- 自我介紹
- 項目(項目問了特別久,因爲我項目裏用到了spark gbdt,所以讓我講一下gbdt的原因,問我的數據集多大,樹怎麼調參的等等引申問題
- hive sql統計昨天訪問過的用戶並且今天沒有訪問的用戶
算法題
輸入點對: A B C D H I B G H J 輸出: A B G C D H I J 類似這樣的對,實現合併
二面(大約1個小時)
- 自我介紹
- 算法題:LeetCode#64原題 我用二維數組DP寫出來了 面試官的follow up 如何優化空間複雜度即用o(n)實現
- 100w個數,如何找出前K大的數 (我一開始回答利用集羣來處理,後面面試官想聽到的其實是堆排序和快排來實現)
- 聊項目
- 推導LR
- LR怎麼防止過擬合
- L1和L2(L1和L2是什麼,爲什麼L1能產生稀疏解)
- 線性相關特徵對LR和GBDT訓練結果會有影響?
- 概率題:從1-M這M個數中有放回的隨機抽取K次,求最大值的期望(這個題目一開始我沒有get到題意)M的k次冪-(M-1)的K次冪,再除以M的k次冪
大概記得的就這些內容了,二面面試官看起來很強
微博實習生面試記錄
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.