算法面試彙總

原創

linxid

2020-06-16 11:06

阿里媽媽一面：

這是我遇見最難得面試，最難，最難，重要的說三遍；

自我介紹，這都是套路了，簡單介紹就好；
介紹比賽過程，怎麼做的比賽，然後隨機提問；
從Boosting到AdaBoost到GBDT到LightGBM介紹演變路線，各個模型到底是怎麼回事；
怎麼做的特徵工程，哪些特徵比較重要；
一定要做EDA和特徵工程嗎，這裏回答比較傳統，應該比較lightgbm和NN，NN的優勢就是避免了特徵工程；
不同的模型（主要分析lgb和NN）數據應該如何處理，有什麼不同的處理方式嗎，爲什麼會有不同；
比賽用的什麼指標，ROC，ROC是怎麼得來的，知道G-ROC嗎，ROC評價指標是否合理，有沒想過考慮其他的；
NN怎麼來做這種任務，從MLP到DeepFM（簡單的思想）；
怎麼避免過擬合，老生常談了，如何避免欠擬合，這裏簡單的整理了下，歡迎補充；
問了一個概率題，我是很懵逼，一個骰子，隨機往桌子上扔，求扔多少次，每個面至少出現一次，扔的次數的平均值（十分爆炸），思路是從最少的次數到最大的次數，然後求各個次數每個面至少出現一次的概率，得到一個數列後，對這個數列進行求和，n趨向於無窮大求極限；從這裏基本就炸了；
有兩根不均勻分佈的香香燒完的時間是一個小時，你能用什麼方法來確定一段15分鐘的時間；我當時沒想出來，非腦筋急轉彎；
介紹下高斯分佈和泊松分佈，以及泊松分佈和二項分佈的關係；
強化學習瞭解嗎，簡單介紹下；
能否將一個思想或者任務，擴展到多個方面，是個開放性問題，舉例子比如說強化學習除了常見的用在遊戲中，其他領域如何應用，考察理解的廣度；
Leetcode Medium題56. Merge Intervals 當時忘了最優怎麼做了，非常尷尬，哎，表現最不好的地方吧。
關於特徵工程的一些討論，是否有必要；
你的興趣是什麼，以後想從事什麼工作，其實這個想問是否和他們的工作契合吧，我換了一種回答方式；
在小米的工作任務是啥，音樂分類，簡單介紹下如何實現音樂分類，兩種方法分別是什麼；
關於論文的一些討論，還有學校的一些事情；

華爲一面

自我介紹
介紹Quora比賽，具體是什麼，都做了哪些工作；
AiChallenger都做了什麼，這個比賽是怎麼回事；
Word2Vec、Glove、fasttext分別是什麼，如何得到的，相互比較；
如何得到句子向量，和詞向量的關係；
什麼時候開始學NLP，專業和導師是做什麼的，是否自學；
attention機制是怎麼回事；
RNN、LSTM等怎麼回事，有什麼缺陷；
attention機制的softmax是怎麼做的；
transformer是怎麼回事；
樣本不均衡如何來解決；
如何避免過擬合；
常用什麼語言，什麼框架；
神經網絡如何調參，煉丹的思想；
簡述貝葉斯調參；
在瀚思科技（第一家實習公司）的實習經歷，在小米的工作和任務；

騰訊一面

自我介紹
介紹自己的比賽經歷，詳細介紹科大訊飛的比賽過程；
比賽任務是什麼，都包括哪些特徵；
在小米的實習經歷，工作內容是什麼；
GBDT和XGBoost分別是什麼回事，區別是什麼；
XGBoost並行化是怎麼回事且是如何實現的；
提取了什麼特徵；
手機品牌的特徵如何進行分析的；
stacking的原理是什麼；
開放性問題（這個問題問的最久），如何根絕王者榮耀玩家的歷史信息，對玩家進行道具和皮膚的推薦；
對於上述問題，如何推薦金幣卡和經驗卡，提取哪些特徵；
對於大規模稀疏數據如何處理，訓練一個模型還是多個模型；
FM、FFM相關的簡單介紹；
介紹下Mapreduce和Hadoop相關的原理；
Spark的某個函數如何使用；

騰訊二面:

簡單介紹，本科是哪，能什麼時候來實習；
問比賽和項目經驗，非常細，挑自己最熟悉的講；
從頭到位介紹了科大訊飛的比賽過程和比賽細節，一定足夠熟悉比賽過程；
特徵選擇的方法，嵌入法（lgb）Vs過濾法（卡方檢驗）；
爲什麼這些特徵用lgb篩選，另一些特徵用卡方檢驗來篩選；
爲什麼用5折交叉；
模型融合，爲什麼融合，怎麼融合，何爲最優模型。這個地方討論了很多，要深刻理解模型訓練的實質，模型學習train，val，test的統計分佈。這裏我的回答非常不確定，應該和實際的工程相關，模型訓練的目標不是單純的比賽刷榜，而是提高泛化能力。
有沒有做數據預處理，如何做的；
和Top的差距在哪裏，後來有發現什麼提高模型的辦法嗎；
Quora比賽，如何做的，模型的輸入是什麼，這個比賽最後選擇的方案是什麼；
Aichallenger比賽，細粒度，粒度都是什麼，如何訓練的。比賽內容的介紹。文本長度，模型輸入是什麼等等；
lightgbm爲什麼比xgboost快；
比賽分工是什麼；

參考資料

[1] https://www.nowcoder.com/discuss/143458
[2] https://zhuanlan.zhihu.com/p/59259010

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

算法面試彙總

阿里媽媽一面：

華爲一面

騰訊一面

騰訊二面:

參考資料

杭州的 IT 崩盤了麼？

開源高性能結構化日誌模塊NanoLog

Python 潮流週刊#55：分享 9 個高質量的技術類信息源！

Azure Virtual Network (22) 多訂閱使用Azure DNS解析問題 Windows Azure Platform 系列文章目錄

【簡寫Mybatis-02】註冊機的實現以及SqlSession處理

手繪二維碼

.NET藉助虛擬網卡實現一個簡單異地組網工具

keras學習筆記(二)：實現f1_score(多分類、二分類)

Ubuntu配置（三）：命令行彙總

Andrew Ng-深度學習-第一門課-week3（激活函數和BP）

算法面試彙總

A Sensitivity Analysis of Convolutional Neural Networks for Sentence：論文解讀

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結