面經 |算法工程師面試題彙總分享

面經 |算法工程師面試題彙總分享

來源:https://github.com/PPshrimpGo/AIinterview

0 導讀
本文彙總了 深度學習(模型評估方法、基本方法、優化方法、深度學習基礎、CNN、RNN)、機器學習(基礎、集成學習、模型 、特徵工程)、數據結構與算法(二叉樹類、搜索回溯、概率題、動態規劃、字符串)、數組、二分、快排系列(鏈表、排序)、海量數據題等各類型算法崗面試題。

1 深度學習

模型評估方法
1)Accuracy作爲指標有哪些侷限性?

2)ROC曲線和PR曲線各是什麼?

3)編程實現AUC的計算,並指出複雜度?

4)AUC指標有什麼特點?放縮結果對AUC是否有影響?

5)餘弦距離與歐式距離有什麼特點?

基本方法
1)如何劃分訓練集?如何選取驗證集?

2)什麼是偏差和方差?

3)什麼是過擬合?深度學習解決過擬合的方法有哪

4)解決欠擬合的方法有哪些?

5)深度模型參數調整的一般方法論?

優化方法
1)簡述瞭解的優化器,發展綜述?

2)常用的損失函數有哪些?分別適用於什麼場景?

3)梯度下降與擬牛頓法的異同?

4)L1和L2正則分別有什麼特點?爲何L1稀疏?

深度學習基礎
1)以一層隱層的神經網絡,relu激活,MSE作爲損失函數推導反向傳播

2)NN的權重參數能否初始化爲0?

3)什麼是梯度消失和梯度爆炸?

4)常用的激活函數,導數?

5)relu的有優點?又有什麼侷限性?他們的系列改進方法是啥?

6)sigmoid和tanh爲什麼會導致梯度消失?

7)一個隱層需要多少節點能實現包含n元輸入的任意布爾函數?

8)多個隱層實現包含n元輸入的任意布爾函數,需要多少節點和網絡層?

9)dropout爲何能防止過擬合?

10)dropout和BN 在前向傳播和方向傳播階段的區別?

CNN
1)給定卷積核的尺寸,特徵圖大小計算方法?

2)網絡容量計算方法

3)共享參數有什麼優點

4)常用的池化操作有哪些?有什麼特點?

5)CNN如何用於文本分類?

6)resnet提出的背景和核心理論是?

7)空洞卷積是什麼?有什麼應用場景?

RNN
1)簡述RNN,LSTM,GRU的區別和聯繫

2)畫出lstm的結構圖,寫出公式

3)RNN的梯度消失問題?如何解決?

4)lstm中是否可以用relu作爲激活函數?

5)lstm各個門分別使用什麼激活函數?

6)簡述seq2seq模型?

7)seq2seq在解碼時候有哪些方法?

8)Attention機制是什麼?

2 機器學習

基礎
1)樣本不均衡如何處理?

2)什麼是生成模型什麼是判別模型?

集成學習
1)集成學習的分類?有什麼代表性的模型和方法?

2)如何從偏差和方差的角度解釋bagging和boosting的原理?

3)GBDT的原理?和Xgboost的區別聯繫?

4)adaboost和gbdt的區別聯繫?

模型
1)手推LR、Kmeans、SVM

2)簡述ridge和lasson的區別和聯繫

3)樹模型如何調參

4)樹模型如何剪枝?

5)是否存一定存在參數,使得SVM的訓練誤差能到0

6)邏輯迴歸如何處理多分類?

7)決策樹有哪些劃分指標?區別與聯繫?

8)簡述SVD和PCA的區別和聯繫?

9)如何使用梯度下降方法進行矩陣分解?

10)LDA與PCA的區別與聯繫?

特徵工程
1)常用的特徵篩選方法有哪些?

2)文本如何構造特徵?

3)類別變量如何構造特徵?

4)連續值變量如何構造特徵?

5)哪些模型需要對特徵進行歸一化?

6)什麼是組合特徵?如何處理高維組合特徵?

其他(分方向)
1)word2vec的原理,glove的原理,fasttext的原理?

2)cbow和skipgram如何選擇?

3)瞭解elmo和bert嗎?簡述與word embedding的聯繫和區別

4)圖像和文本和語音數據各有哪些數據增強方法?

5)rcnn、fatse rcnn、fatser rcnn、mask rcnn的原理?

6)介紹resnet和GoogLeNet中的inception module的結構?

7)介紹yolo和ssd ?

8)介紹FM,FFM,deepFM,deepWide.

9)機器翻譯如何解決oov?

等等

3 數據結構與算法

二叉樹類
1)前中後的非遞歸?

2)層次遍歷,之字遍歷?

3)二叉樹的序列化與反序列化

4)前中,後中遍歷結果恢復二叉樹

5)排序二叉樹的序列化

6)二叉樹的直徑

7)二叉樹的路徑和爲定值的路徑

8)翻轉、複製二叉樹

9)排序二叉樹轉雙向鏈表

10)判斷二叉樹是否相同?判斷一棵樹是不是另一棵樹的子樹?

搜索回溯
1)八皇后,全排列,組合

2)重複數字的排列,重複數字的組合

3)圖的搜索

4)A star

概率題
1)用rand7構造rand10

2)輪盤賭

3)三角形內等概論隨機選點

等等

動態規劃
1)編輯距離

2)揹包

3)LCS

字符串
1)給定字符串是否符合正則表達式XXX

2)給定字符串是否是數字?

3)KMP

4)超大數相加

數組、二分、快排系列
1)旋轉數組查找

2)數組中的topk

3)旋轉打印數組

4)行列遞增矩陣查找數字

5)查找出現超過一半的數字

6)查找和爲定值的兩個數

鏈表
1)翻轉鏈表

2)兩個鏈表是否有交點

3)一個鏈表是否有環

4)鏈表的倒數k個節點

5)合併鏈表

6)逆序打印鏈表

排序
1)各種排序的複雜度最優最差平均

2)堆排序topk

3)快排的變化

海量數據題
1)海量日誌的出現最多的10個字符串

2)10億個1-10的數字排序

3)trie樹

4)hashmap

5)布隆過濾器

6)bitmap

等等

-End-

在這裏插入圖片描述

(關注微信公衆號“StrongerTang”,看更多文章,和小湯一起學習,一同進步!)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章