机器学习-线性回归

1.线性回归如何产生

有一堆离散的数据，它们是描述的是同一类问题。对这些数据我们用函数来拟合这些数据。并且该函数能让误差达到一个最小值。这时，我们便称该函数为一个模型，使用该模型，我们可以输入未知的参数然后得到一个预测值，一般来说这些值都比较接近真实值。很明显，我们的任务就是求出该函数 $f (x) = θ^{T} x$

2.求解线性回归

2.1似然函数

1.假设已存在该函数
$f (x) = θ^{T} x$

2.该数据集的真实数据可表示为
$y^{(i)} = θ^{T} x^{(i)} + ε^{(i)}$

ε表示误差，一般来说，我们认为如果一个这些误差服从高斯分布，那么该模型就是一个比较不错的模型。至于为什么，看看高斯分布就明白了

3.高斯分布公式为
$p (ε^{(i)}) = \frac{1}{\sqrt{(2 π σ)}} e x p (- \frac{(ε^{(i)})^{2})}{2 σ^{2}})$

4.将2带入3
$p (y^{(i)} | x^{(i)}; θ) = \frac{1}{\sqrt{(2 π σ)}} e x p (- \frac{(y^{(i)} - θ^{T} x^{(i)})^{2})}{2 σ^{2}})$

5.此时引入一个似然函数的概念，即
$L (θ) = \prod_{i = 1}^{n} p (y^{(i)} | x^{(i)}; θ) = \prod_{i = 1}^{n} \frac{1}{\sqrt{(2 π σ)}} e x p (- \frac{(y^{(i)} - θ^{T} x^{(i)})^{2})}{2 σ^{2}})$

如何理解这个似然函数呢，开头我们就说了，我们只是假设该模型已存在即θ值已确定做的推导，我们最终要解决的问题还是确定这个θ值。
似然函数公式上的理解：高斯分布表示的是我们误差分布的概率，我们力求误差为0，概率最大为1。所以我们力求总和最大，来保证误差最小。很简单。
似然函数更普遍的理解：目前，θ值不确定，我们关于ε的高斯模型也是一个不确定的。所以我们需要选择一个高斯模型，使得在该模型下，我们的预测结果是正确结果的可能性最大。那么我们便将所有的预测概率做一个连乘，求目标函数的最大值。
关于这个似然函数的作用，捡一个例子举一下。对于对于一个正反均匀的硬币，连续掷10次这个问题，我们可以问它连续10次都是正面的概率是多少。而对于一枚硬币连续掷10次都是正面，我们求它正反均匀的概率是多少。似然函数便是解决这个问题。

2.2目标函数

1.原始似然函数不方便求解，因为是连成形式，观察函数原型，变量处于exp，所以我们可以直接取对数进行转换。
$l o g L (θ) = l o g \prod_{i = 1}^{n} \frac{1}{\sqrt{(2 π σ)}} e x p (- \frac{(y^{(i)} - θ^{T} x^{(i)})^{2})}{2 σ^{2}})$
$= \sum_{i = 1}^{n} l o g \frac{1}{\sqrt{(2 π σ)}} e x p (- \frac{(y^{(i)} - θ^{T} x^{(i)})^{2})}{2 σ^{2}})$
$= m l o g \frac{1}{\sqrt{(2 π σ)}} - \frac{1}{σ^{2}} \cdot \frac{1}{2} \sum_{i = 1}^{n} (y^{(i)} - θ^{T} x^{(i)})^{2})$

2.目标函数求最小值
$J (θ) = \frac{1}{2} \sum_{i = 1}^{n} (y^{(i)} - θ^{T} x^{(i)})^{2})$
根据矩阵的一些变换公式化简求导。不想写latex表达式，太麻烦了。
最终得到 $θ = (X^{T} X)^{- 1)} X^{T} y$
能够直接给出θ的值
所以线性回归是回归算法中很特殊的一种。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

机器学习-线性回归

机器学习-线性回归

1.线性回归如何产生

2.求解线性回归

2.1似然函数

2.2目标函数

使用c#强大的表达式树实现对象的深克隆之解决循环引用的问题

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU启动那些事（12.A）- uSDHC eMMC启动时间(RT1170)

本地SSL证书过期输入命令在IIS自动生成

go http1.1 長連接編程

高併發map&chan連接池bug1

高併發下map和chan實現的鏈接池的線程安全及效率

機器學習-線性迴歸

goyacc

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結