2020算法面试总结(二)

这部分只要是说一些深度学习方面的面试总结。

机器学习拟合问题

如何判断拟合情况

通过看训练集误差和验证集误差对比
欠拟合:训练集和验证集的误差都较大,但相差很少
适度拟合:训练集和验证集的误差都很低
过拟合:训练集误差较低,验证集误差比训练集大得多

解决拟合问题

解决过拟合:
增加数据集的样本数、降低模型复杂度、减少训练时间、加正则化(L1/L2)、dropout、mini-batch、结合多种模型
解决欠拟合:模型特征项不够
添加多项式特征、减少正则化参数

模型基础

张量\数据流图

张量在Python中就是数据类型(多维数组)
TensorFlow提供了专门处理高维稀疏数据的SparseTensor类,该类以键值对的形式表示高维稀疏数据,其包含indices、values、dense_shape这3个属性,indices代表形状为[N, ndims]的Tensor实例, N为非零元素的个数, ndims表示张量阶数。values是一个形状为[N]的对象,用于保存indices中指定的非零元素。dense_shape是一个形状为[ndims]的Tensor实例,表示该稀疏张量对应稠密张量的形状。

数据流图是一个具有计算拓扑和内部结构的“壳”,实际上就是模型具体实现的数据变换过程。

优化器(性能指标)

激活、损失、优化
激活函数是负责神经元上下层之间数据的非线性映射
损失函数是表现模型输出的推理值与真实值之间的差异函数
优化函数就是如何更好更快的找到最优参数求解

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章