线性回归VS最小二乘法的本质是什么

原創

2020-12-01 03:02

最小平方法是十九世纪统计学的主题曲,从许多方面来看, 它之于统计学就相当于十八世纪的微积分之于数学。
----史蒂芬·史蒂格勒的《The History of Statistics》

日用而不知

来看一个生活中的例子。比如说，有五把尺子：

用它们来分别测量一线段的长度，得到的数值分别为（颜色指不同的尺子）：

之所以出现不同的值可能因为：

不同厂家的尺子的生产精度不同
尺子材质不同，热胀冷缩不一样
测量的时候心情起伏不定
......

总之就是有误差，这种情况下，一般取平均值来作为线段的长度：

日常中就是这么使用的。可是作为很事'er的数学爱好者，自然要想下：

这样做有道理吗？
用调和平均数行不行？
用中位数行不行？
用几何平均数行不行？

最小二乘法

换一种思路来思考刚才的问题。

首先，把测试得到的值画在笛卡尔座标系中，分别记作yi

其次，把要猜测的线段长度的真实值用平行于横轴的直线来表示（因为是猜测的，所以用虚线来画），记作y

每个点都向y做垂线，垂线的长度就是|y-yi| ，也可以理解为测量值和真实值之间的误差：

因为误差是长度，还要取绝对值，计算起来麻烦，就干脆用平方来代表误差：

误差的平方和就是ε (error)代表误差：

因为y是猜测的，所以可以不断变换：

自然，误差的平方和在不断变化的。

法国数学家，阿德里安-马里·勒让德（1752－1833，这个头像有点抽象）提出让总的误差的平方最小的y就是真值，这是基于，如果误差是随机的，应该围绕真值上下波动（关于这点可以看下“如何理解无偏估计？”）。

勒让德的想法变成代数式就是：

正好是算术平均数。

原来算术平均数可以让误差最小啊，这下看来选用它显得讲道理了。
就是最小二乘法，所谓“二乘”就是平方的意思，台湾直接翻译为最小平方法。

基本形式

给定由d个属性描述的示例x={x1;x2;...;xd}

，其中xi是x现在第 i个属性上取值，线性模型去学习一个通过属性的线性组合来进行预测的函数，即

一般用向量形式表示更为简洁：

其中，

其实可以很简单的理解，如下图直线是由很多点组成的，如果事先不知道直线的方程，只有一些点，那么根据这些点求得的函数就是这条直线。我们的任务就是根据已知的一些数据求解得到函数。当然这只是一元线性回归，还有多元线性回归与之类似。

回归分析中，如果只包括一个自变量和一个因变量，且二者的关系可用一条直线近似表示，这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量，且因变量和自变量之间是线性关系，则称为多元线性回归分析。对于二维空间线性是一条直线；对于三维空间线性是一个平面，对于多维空间线性就是一个超平面。

一元线性回归

给定数据集：

其中，

和

而线性回归视图学得：

, 使得

其实就是找到一个函数使得数据尽可能的在这个函数内。那么如何确定参数w和b呢？
显然，关键在于如何衡量f(xi)与yi之间的差距，我们使用均方误差来进行度量。因此我们将差距最小问题转化为均方误差最小化，即

其中，

分别表示w和 b的解。

在线性回归中，最小二乘法就是试图找到一条直线，使得所有样本到直线上的距离之和最小。

求解w和b使

最小化的过程，称之为线性回归模型的最小二乘法“参数估计”(parameter estimation)。为了得到最小值，我们只需要将函数

求导即可。则

分别对w和b求导，得到：

求得倒数为零的解，即为最优解，则令导数

极值点处的导数一定为0，但导数为0的点不一定是极值点

可得到w和b的最优解分别为：

其中，x的均值为

https://www.zhihu.com/question/37031188

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

(原创) odoo各版本对视图中节点groups属性的处理差别

1.14版(含14)視圖節點groups屬性的處理結果表現在可見性上(invisible)，如果當前用戶不在指定的角色中，則設置可見性標記invisible爲"1" 2.16版(含16)以後對視圖節點groups屬性的處理

2024-06-08 14:35:45

lightdb hash index的性能和限制

　　除了btree外，lightdb是支持hash index的，但是總體來說支持的特性範圍均不如btree索引，比如parallel沒有btree索引智能，不支持=之外的操作，不支持bitmap index scan，不支持哈希唯一索引（

2024-06-08 14:32:04

pathlib and difflib

pathlib.Path("a.crt").write_text(a[0]) p.chmod(0o444) Path.cwd() p.write_bytes(b'Binary file contents') p.read_bytes()

2024-06-08 14:31:34

利用WinSW将Nginx 作为可正常启动/停止的windows服务

下載winsw程序，Releases · winsw/winsw (github.com) 將下載的exe文件放置到nginx.exe的同級目錄，名字可以修改爲nginx-service.exe(也可不修改) 新建txt文本文檔，並將其名

漫漫人生路總會錯幾步

2024-06-08 14:30:54

纯CSS+单个div实现抖音LOGO

純CSS+單個div就能繪製抖音LOGO 關鍵點：主要藉助了兩個僞元素實現了整體結構，藉助了 drop-shadow 生成一層整體陰影 drop-shadow 只能是單層陰影，所以另一層陰影需要多嘗試 contrast(150%) br

2024-06-08 14:30:14

告别Word，用Python打造你的专业简历！

今天給大家介紹下一個在純 python 中構建簡歷的實用工具，工具的連接地址https://github.com/koek67/resume-builder/blob/main/readme.md 用法介紹要求 Python 3.7 或更

2024-06-08 14:24:54

一款.NET开源、免费、实用的多功能原神工具箱（改善桌面端玩家的游戏体验）

前言今天大姚給大家分享一款.NET開源（MIT License）、免費、實用的多功能原神工具箱，旨在改善桌面端玩家的遊戲體驗：胡桃工具箱。工具箱介紹胡桃工具箱是一款.NET開源（MIT License）、免費、實用的多功能原神工具箱

2024-06-08 14:24:33

辐射3刷药

去megaton裏面的屍鬼.那裏買藥, 把破爛賣給他. 然後傳送到其他地圖, 再傳送回來, 他就又有錢和新藥了.繼續賣破爛, 買藥.刷幾次就夠了.

張博的博客

2024-06-08 14:22:03

重新研究go的并发模型.

go裏面可以實現很多併發模型的優雅解決方案. 總結起來. package main import ( "fmt" "time" ) var bufChan chan int = make(chan int, 1000) var

張博的博客

2024-06-08 14:22:03

Python 潮流周刊#54：ChatTTS 强大的文本生成语音模型

本週刊由 Python貓出品，精心篩選國內外的 250+ 信息源，爲你挑選最值得分享的文章、教程、開源項目、軟件工具、播客和視頻、熱門話題等內容。願景：幫助所有讀者精進 Python 技術，並增長職業和副業的收入。本期週刊分享了 12

豌豆花下貓

2024-06-08 14:21:23

kafka知识整理——部署

一、部署（1）zk配置修改zk配置文件config/zookeeper.properties，修改dataDir或端口 dataDir=/home/kafka/kafka3.7/data/zookeeper clientPort=218

2024-06-08 14:16:43

Asp .Net Core 系列：详解鉴权（身份验证）以及实现 Cookie、JWT、自定义三种鉴权（含源码解析）

什麼是鑑權（身份驗證）？ https://learn.microsoft.com/zh-cn/aspnet/core/security/authentication/?view=aspnetcore-8.0 定義鑑權，又稱身份驗證，是

2024-06-08 14:15:33

cdn到oss，根据用户终端是手机和电脑等不同分别访问两套前端代码

使用規則引擎其中一個配置了很多瀏覽器，另外一個配置匹配所有，這樣就能正常訪問。如果這兩個網站，有一個沒有使用規則引擎，那麼就會兩個網站都匹配上，然後第四條規則目標path和第一條的會拼接起來作爲oss的key,肯定不存在，所以

2024-06-08 14:14:22

Codeforces Round 950 (Div. 3)G. Yasya and the Mysterious Tree（字典树处理区间异或值）

Problem - G - Codeforces 存個字典樹板子。 1 #include <bits/stdc++.h> 2 3 using i64 = long long; 4 5 constexpr int N

2024-06-08 14:10:12

Codeforces Round 949 (Div. 2)D. Turtle and Multiplication（欧拉路径、线性筛、思维构造）

Problem - D - Codeforces 思路補充官方正解，主要解釋一下爲什麼可以轉化爲求完全圖的歐拉路徑。題目要求構造的數的種數最少，相當於對於當前的m來說要儘可能構造出最長的序列長度，所以一定儘量要是完全圖。其次要求不

2024-06-08 14:10:12

24小時熱門文章

最新文章

最新評論文章