機器學習(ML
)作爲目前一個比較火領域,提供了許多有趣且高薪的工作和機會。
無論你是剛剛踏入機器學習領域的新手,還是已經積累了一定經驗的從業者,面試都是檢驗你技能和知識的重要環節。
本文將梳理一些常見的面試問題,讓你在面試中更加自信從容。
1. 基礎知識
想要從事機器學習工作,至少應該熟悉:
- 數學基礎:包括線性代數、微積分、優化、概率和統計等
- 機器學習基礎:準備數據、驗證和改進訓練結果、解釋模型、識別和避免過度擬合等
- 常用算法:比如線性迴歸、決策樹、支持向量機、k 最近鄰、神經網絡、k 均值聚類、主成分分析等
- 編程能力:需要一些
Python
等編程語言知識,以及使用機器學習庫的能力(如 NumPy、Pandas、scikit-learn、Matplotlib、Tensorflow 等)等
2. 常見問題整理
接下來,整理了一些適合初學者和中級人員的一般問題,這些問題與任何特定的機器學習算法或方法無關。
通過掌握這些常見問題及其解答思路,不僅能更加深入地理解機器學習的核心概念,還能在面試中展現出你的專業素養和解決問題的能力。
2.1. 機器學習算法有哪些類型
機器學習算法主要分爲三種類型:
- 監督學習:對給定輸入數據(特徵)和輸出數據之間的數學依賴關係(映射)進行建模。
主要解決迴歸和分類問題,其中迴歸問題具有連續的數字輸出,而分類則處理離散的、通常是分類的輸出。
- 無監督學習:在不提供任何輸出的情況下在輸入數據中查找結構、規則和模式。
無監督學習方法有幾類,例如聚類分析、關聯規則學習、異常檢測等。
- 強化學習:採取行動最大化獎勵,並根據過去的經驗不斷學習和改進。
此外,還有半監督學習,它介於監督學習和無監督學習之間。
2.2. 什麼是數據標準化和歸一化
機器學習(ML)中數據集標準化之後,就可以比較不同單位的特徵,這是許多 ML
方法(如支持向量機、神經網絡、k 均值聚類、線性判別分析等)的要求。
標準化通常意味着對特徵進行重新調整,使其均值爲零,標準差爲一。
在某些情況下,可以使用最小-最大標準化來代替,它重新調整特徵,以便最小值映射到零,最大值映射到一,而所有其他值在零和一之間線性分佈。
2.3. 什麼是R2
R2 (決定係數)是一個數值,表示輸入能夠解釋輸出的程度。
一般用作擬合優度的度量,即迴歸問題中實際輸出和預測輸出的接近程度,此值越大越好,R2 = 1 表示完美擬合。
2.4. I類和II類錯誤是什麼
I 類錯誤(假陽性錯誤)表示錯誤地拒絕了真實的原假設。
II 類錯誤(假陰性錯誤)是錯誤地接受錯誤的原假設。
2.5. 條件概率是什麼
條件概率是在某些事件已經發生的情況下事件將發生的概率。
比如,在事件 F 發生的情況下,事件 E 發生的概率爲:P(E|F) = P(EF) / P(F),其中** P(EF)** 是兩個事件都發生的概率,而 P (F) 是 F 發生的概率。
2.6. 什麼是訓練、驗證和測試數據集
訓練集是數據集的一部分,用於訓練模型,即擬合其參數;
驗證集是超參數調整期間使用的數據集的另一部分;
測試集是數據集的第三部分,用於評估所選模型的性能。
數據集的這三個部分通常是獨立的並且是隨機選擇的。
2.7. 什麼是過擬合
當模型和現有數據匹配的太好時,通常會發生過度擬合。
過度擬合的模型通常在訓練數據上表現良好,但在應用於看不見的數據(測試數據)時表現不佳。
複雜或靈活的模型更容易出現過度擬合。
2.8. 什麼是降維
降維是一組減少機器學習模型特徵(輸入變量)數量的技術。
降維的主要方法有兩種:
- 特徵選擇:選擇最重要特徵的子集
- 特徵提取:用一組新的、更小的派生特徵替換所有特徵,以最大限度地減少冗餘。
2.9. 內核技巧是什麼
內核技巧與將數據映射到高維空間以使其明顯可分離有關。
它避免計算該空間中數據點的新座標,核技巧對於支持向量機和主成分分析很重要。
2.10. 梯度下降法是什麼
梯度下降是一種快速、迭代、近似、基於梯度的優化方法,旨在找到函數的局部最小值。
它從起點沿最陡下降的方向迭代移動,使用函數的負梯度計算方向和步長。
如果函數是凸函數,則梯度下降搜索全局最小值。
2.11. 什麼是聚類
聚類或聚類分析是根據數據點(觀測值)特徵之間的相似性將數據點(觀測值)分爲兩個或多個組(簇)的過程。
一些聚類方法包括 k 均值聚類、均值漂移聚類、層次聚類、譜聚類、親和傳播、DBSCAN 等。
2.12. 偏差-方差權衡是什麼
偏差是模型預測的輸出與實際輸出之間的差異;
方差是不同訓練集的模型預測變異性的度量。
簡單的模型可能擬合不足,並且具有高偏差和低方差;
相反,複雜模型(具有許多參數)有時會出現低偏差和高方差的過度擬合。
我們想要的是偏差和方差的儘可能低的值,爲了實現這一目標,我們必須找到適當複雜性的模型。
3. 最後
當然,工作面試不僅僅是詢問和回答與領域相關的問題。
還應該關注一些工作面試中的一般建議,比如:
- 預先了解準備面試的公司
- 準備好介紹自己在該領域的經驗、興趣以及想要這份工作的原因
- 準備好介紹自己的優勢和爲什麼適合該職位
- 着裝和舉止得體