这部分只要是说一些深度学习方面的面试总结。
机器学习拟合问题
如何判断拟合情况
通过看训练集误差和验证集误差对比
欠拟合:训练集和验证集的误差都较大,但相差很少
适度拟合:训练集和验证集的误差都很低
过拟合:训练集误差较低,验证集误差比训练集大得多
解决拟合问题
解决过拟合:
增加数据集的样本数、降低模型复杂度、减少训练时间、加正则化(L1/L2)、dropout、mini-batch、结合多种模型
解决欠拟合:模型特征项不够
添加多项式特征、减少正则化参数
模型基础
张量\数据流图
张量在Python中就是数据类型(多维数组)
TensorFlow提供了专门处理高维稀疏数据的SparseTensor类,该类以键值对的形式表示高维稀疏数据,其包含indices、values、dense_shape这3个属性,indices代表形状为[N, ndims]的Tensor实例, N为非零元素的个数, ndims表示张量阶数。values是一个形状为[N]的对象,用于保存indices中指定的非零元素。dense_shape是一个形状为[ndims]的Tensor实例,表示该稀疏张量对应稠密张量的形状。
数据流图是一个具有计算拓扑和内部结构的“壳”,实际上就是模型具体实现的数据变换过程。
优化器(性能指标)
激活、损失、优化
激活函数是负责神经元上下层之间数据的非线性映射
损失函数是表现模型输出的推理值与真实值之间的差异函数
优化函数就是如何更好更快的找到最优参数求解