西瓜书学习——第三章 线性模型

基本形式

给定由 d 个属性描述的示例 x = (X1; X2; … ; Xd) , 其中 Xi 是 X 在 第 i 个属性上的取值,线性模型 (linear model)试图学得一个通过属性的线性组合来进行预测的函数:
在这里插入图片描述
向量形式:
在这里插入图片描述

线性回归

“线性回归” (linear regression)试图学得一个线性模型以尽可能准确地预测实值输出标记.
在这里插入图片描述
即找到一条直线来区分样本,找到ω 和 b 来衡量 f(x) 与 u 之间的差别,因此我们可试图让均方误差最小化:
在这里插入图片描述
ω 和 b 值的确定推导过程如下:
在这里插入图片描述
我们也可将输出标记的对数作为线性模型逼近的目标, 即lny=wTx+blny=w^Tx+b,即对数线性回归,我们试图让
e(wT+b)e^ (w^T+b)逼近y,示意图如下:
在这里插入图片描述
更一般地,我们讲对数函数考虑成一般函数g(.)g(.),令
在这里插入图片描述
这样得到的模型称为广义线性模型.

对数机率回归

我们用到一种sigmoidsigmoid函数对数机率函数y=11+ezy=\frac{1}{1+e^{-z}}将 z 值转化为一个 0 或 1 的 yy 值,将
y=11+ewT+by=\frac{1}{1+e^{-{w^T+b}}}代入得:
在这里插入图片描述
这时我们将 yy 视为类后验概率估计 p(y=1x)p(y=1|x) 则上式可变成
在这里插入图片描述
利用条件概率公式p(AB)=p(AB)p(B)p(A|B)=\frac{p(AB)}{p(B)}可得:
在这里插入图片描述
我们利用最大似然估计来估计ω 和 b:我们令 β=(w;b)\beta=(w;b)
在这里插入图片描述
最后我们得到 β\betat+1t+1 轮迭代的更新公式为:
在这里插入图片描述

线性判别分析

线性判别分析(简称LDA)是一种经典的线性学习方法,思想如下:给定训练样例集,设法将样例投影到一条直线上,使得同类样例的投影点尽可能接近,异类样例的投影点尽可能远离;在对新样本进行分类时,将其投影到同样的这条直线上,再根据投影点的位置来确定新样本的类别.
在这里插入图片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章