微博實習生面試記錄

  • 一面(大約1個小時):

    • 自我介紹
    • 項目(項目問了特別久,因爲我項目裏用到了spark gbdt,所以讓我講一下gbdt的原因,問我的數據集多大,樹怎麼調參的等等引申問題
    • hive sql統計昨天訪問過的用戶並且今天沒有訪問的用戶
    • 算法題

      輸入點對:
      A B
      C D
      H I
      B G
      H J
      輸出:
      A B G
      C D
      H I J
      類似這樣的對,實現合併
      
  • 二面(大約1個小時)

    • 自我介紹
    • 算法題:LeetCode#64原題 我用二維數組DP寫出來了 面試官的follow up 如何優化空間複雜度即用o(n)實現
    • 100w個數,如何找出前K大的數 (我一開始回答利用集羣來處理,後面面試官想聽到的其實是堆排序和快排來實現)
    • 聊項目
    • 推導LR
    • LR怎麼防止過擬合
    • L1和L2(L1和L2是什麼,爲什麼L1能產生稀疏解)
    • 線性相關特徵對LR和GBDT訓練結果會有影響?
    • 概率題:從1-M這M個數中有放回的隨機抽取K次,求最大值的期望(這個題目一開始我沒有get到題意)M的k次冪-(M-1)的K次冪,再除以M的k次冪

    大概記得的就這些內容了,二面面試官看起來很強

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章