笔记9-机器学习2

如何同时提高precision和recall

 

为什么需要onehot编码?

https://zhuanlan.zhihu.com/p/80893166

首先onehot应用在分类问题对label的编码中,它的特点是使得各个类别之间距离相等。如果不使用onehot而是直接使用0, 1,2这样的数值来代替类别,那么不同类之间的距离就不同了,那么这个问题就 变成了回归的问题。另外因为one-hot中一个维度对应一个特征的关系,特征选择后可以直接降低one-hot编码的维度。

但是需要注意的是,有些分类问题中不同类别之间的距离是不同的,这时直接使用onehot是不妥的,可以在计算损失时按照不同距离之间的比例关系,给不同类别之间赋予不同的权重。

MaxOut激活函数

L-Softmax

https://zhuanlan.zhihu.com/p/84261730

  1. 可调节的类间角度边界约束,新的分类准则对正确分类 提出了更强的要求,为第1类生成了更严格的decision boundary(决策边界),更直接的从几何角度看,如图1,从代数角度解释损失更难收敛,如图2
  2. 是同类别特征向量距离变小,类间距离变大
  3. 分段函数,在π/m出两端函数值应相等,分段的目的也就是束缚函数只对当前类别起作用,[0,π/m]的函数是递减函数注意

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章