机器学习拟合问题

如何判断拟合情况

通过看训练集误差和验证集误差对比
欠拟合：训练集和验证集的误差都较大，但相差很少
适度拟合：训练集和验证集的误差都很低
过拟合：训练集误差较低，验证集误差比训练集大得多

解决拟合问题

解决过拟合：
增加数据集的样本数、降低模型复杂度、减少训练时间、加正则化（L1/L2）、dropout、mini-batch、结合多种模型
解决欠拟合：模型特征项不够
添加多项式特征、减少正则化参数

模型基础

张量\数据流图

张量在Python中就是数据类型（多维数组）
TensorFlow提供了专门处理高维稀疏数据的SparseTensor类，该类以键值对的形式表示高维稀疏数据，其包含indices、values、dense_shape这3个属性，indices代表形状为[N, ndims]的Tensor实例， N为非零元素的个数， ndims表示张量阶数。values是一个形状为[N]的对象，用于保存indices中指定的非零元素。dense_shape是一个形状为[ndims]的Tensor实例，表示该稀疏张量对应稠密张量的形状。

数据流图是一个具有计算拓扑和内部结构的“壳”，实际上就是模型具体实现的数据变换过程。

优化器（性能指标）

激活、损失、优化
激活函数是负责神经元上下层之间数据的非线性映射
损失函数是表现模型输出的推理值与真实值之间的差异函数
优化函数就是如何更好更快的找到最优参数求解

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

2020算法面试总结（二）

机器学习拟合问题

如何判断拟合情况

解决拟合问题

模型基础

张量\数据流图

优化器（性能指标）

985 硕士程序员，空窗 4 个月没有 Offer！

一文搞懂 Spring 循环依赖

赛博斗地主——使用大语言模型扮演Agent智能体玩牌类游戏。

VScode右键打开(添加到右键)

记一次 .NET某工控视觉自动化系统卡死分析

3D目標檢測的實現（CV+TF）

初學flask之身份證上傳

2020算法面試總結（二）

diff/find解決版本差異

算法與基礎

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結