机器学习求职面试55问

类型一:基础概念类问题

问题1:过拟合与欠拟合(定义、产生的原因、解决的方法各是什么)。

问题2:L1正则与L2正则(有哪些常见的正则化方法?作用各是什么?区别是什么?为什么加正则化项能防止模型过拟合)。

问题3:模型方差和偏差(能解释一下机器学习中的方差和偏差吗?哪些模型是降低模型方差的?哪些模型是降低模型偏差的?举例说明一下)。

问题4:奥卡姆剃刀(说一说机器学习中的奥卡姆梯刀原理)。

问题5:模型评估指标(回归模型和分类模型各有哪些常见的评估指标?各自的含义是什么?解释一下AUC?你在平时的实践过程中用到过哪些评估指标?为什么要选择这些指标)。

问题6:风险函数(说一下经验风险和结构风险的含义和异同点)。

问题7:优化算法(机器学习中常见的优化算法有哪些?梯度下降法和牛顿法的原理推导)。

问题8:激活函数(神经网络模型中常用的激活函数有哪些?说一下各自的特点)。

问题9:核函数(核函数的定义和作用是什么?常用的核函数有哪些?你用过哪些核函数?说一下高斯核函数中的参数作用)。

问题10:梯度消失与梯度爆炸(解释一下梯度消失与梯度爆炸问题,各自有什么解决方案)。

问题11:有监督学习和无监督学习(说一下有监督学习和无监督学习的特点,举例说明一下)。

问题12:生成模型与判别模型(你知道生成模型和判别模型吗?各自的特点是什么?哪些模型是生成模型,哪些模型是判别模型)。

类型二:模型原理类

问题13:线性回归(线性回归模型的原理、损失函数、正则化项)。

问题14:KNN模型(KNN模型的原理、三要素、优化方案以及模型的优/缺点)。

问题15:朴素贝叶斯(朴素贝叶斯模型的原理推导,拉普拉斯平滑,后验概率最大化的含义以及模型的优/缺点)。

问题16:决策树(决策树模型的原理、特征评价指标、剪枝过程和原理、几种常见的决策树模型、各自的优/缺点)。

问题17:随机森林模型(RF模型的基本原理,RF模型的两个“随机”。从偏差和方差角度说一下RF模型的优/缺点,以及RF模型和梯度提升树模型的区别)。

问题18:AdaBoost(AdaBoost 模型的原理推导、从偏差和方差角度说一下AdaBoost、AdaBoost模型的优/缺点)。

问题19:梯度提升树模型(GBDT模型的原理推导、使用GBDT模型进行特征组合的过程、GBDT模型的优/缺点)。

问题20:XGBoost(XGBoost模型的基本原理、XGBoost模型和GBDT模型的异同点、XGBoost模型的优/缺点)。

问题21:Logistic回归模型(LR模型的原理、本质,LR模型的损失函数,能否使用均方损失、为什么)。

问题22:支持向量机模型(SVM模型的原理,什么是“支持向量”?为什么使用拉格朗日对偶性?说一下KKT条件、软间隔SVM和硬间隔SVM的异同点。SVM怎样实现非线性分类?SVM常用的核函数有哪些?SVM模型的优/缺点各是什么)。

问题23:K-Means聚类(K-Means聚类的过程和原理是什么?优化方案有哪些?各自优/缺点是什么)。

问题24:层次聚类(层次聚类的过程、原理和优/缺点)。

问题25:密度聚类(密度聚类的基本原理和优/缺点)。

问题26:谱聚类(谱聚类的基本原理和优/缺点)。

问题27:高斯混合聚类(高斯混合聚类的原理和优/缺点)。

问题28:EM算法(EM算法的推导过程和应用场景)。

问题29:特征分解与奇异值分解(特征分解与奇异值分解的原理、异同点、应用场景)。

问题30:主成分分析(PCA模型的原理、过程、应用场景)。

问题31:线性判别分析(LDA模型的原理、过程、应用场景)。

问题32:局部线性嵌入(LLE模型的原理、过程、应用场景)。

问题33:词向量(Word2Vec模型和Doc2Vec模型的类别,各自原理推导、应用和参数调节)。

问题34:深度神经网络(深度神经网络模型的原理,反向传播的推导过程,常用的激活函数,梯度消失与梯度爆炸问题怎么解决?说一下深度神经网络中的Dropout、早停、正则化)。

类型三:模型比较类问题

35:LR模型与SVM模型的异同点。

问题36:LR模型与朴素贝叶斯模型的异同点。

问题37:K近邻模型与K-Means模型的异同点。

问题38:ID3决策树、C4.5决策树、CART决策树的异同点。

问题39:PCA模型与LDA模型的异同点。

问题40:Bagging模型与Boosting模型的异同点。

问题41:GBDT模型与XGBoost模型的异同点。

问题42:Word2Vec模型中CWOB模式与Skip模式的异同点。

问题43:Word2Vec模型和Doc2Vec模型的异同点。

类型四:模型技巧类

问题44:模型调参(随便选一个上述涉及的模型,说一下它的调参方式与过程)。

问题45:特征组合(常见的特征组合方式有哪些?各自特点是什么)。

问题46:特征工程(结合实践解释一下你所理解的特征工程)。

问题47:缺失值问题(说一下你遇到的缺失值处理问题,你知道哪些缺失值处理方式?你使用过哪些,效果怎样)。

问题48:样本不平衡问题(你知道样本不平衡问题吗?你是怎样处理的?效果怎么样?除上采样和下采样外,你还能自己设计什么比较新颖的方式吗)。

问题49:特征筛选(特征筛选有哪几种常见的方式?结合自己的实践经验说一下各自的原理和特点。)

问题50:模型选择(你一般怎样挑选合适的模型?有实际的例子吗?)

问题51:模型组合(你知道哪些模型组合方式?除了运用AdaBoost和RF,你自己有使用过Bagging和Embedding方式组合模型吗?结合实际例子说明一下)。

问题52:A/B测试(了解A/B测试吗?为什么要使用A/B测试)。

问题53:降维(为什么要使用降维?你知道哪些降维方法?你用过哪些降维方式?结合实际使用说明一下)。

问题54:项目(你做过哪些相关的项目?挑一个你觉得印象最深刻的说明一下)。

问题55:踩过的坑(你在使用机器学习模型中踩过哪些坑?最后你是如何解决的)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章