coursera ML筆記 ----week2 多變量的線性迴歸

原創

2020-02-22 14:21

2017/3/10 week2
多變量的線性迴歸

h θ (x) = Θ T X = θ 0 + θ 1 x 1 + θ 2 x 2 + . . . + θ n x n

cost function

J (Θ) = 1 2 m \sum i = 1 m (y^- y i) 2 = 1 2 m \sum i = 1 m (h θ (x i) - y i) 2

Gradient descent: 同步變化！

θ j : = θ j - α \partial J ( Θ ) \partial θ j = θ j - 1 m \sum i = 1 m (h θ (x (i)) - y (i)) x (i) j

其中

Θ=(θ0,θ1,θ2,...,θn),x(i)0=1

θ = θ - α δ

其中

δ=1m∑mi=1(hθ(x)−y(i))x(i) 其中

x(i) 也是一個向量

Feature scaling : make sure features are on a similar sacle

x i - v a l u e r a n g e

其實就是normalization！將特徵值normalize到統一的範圍，消除特徵的值太大或太小帶來的影響，可以把範圍統一在[0，1] or [-1，1]。NG在課程裏面提到的他一般的選取range是超過[-3，3]會縮小，小於[-1/3,1/3]的會捨棄。
Mean Normalization

x i - μ i S i

其中

μi 是每個特徵的均值，

Si 在此處是range=max-min，以後可以換成標準差 standard deviation.該式不適用於

Normal Equation
solve θ 不通過偏導=0 來求解代價函數的最小值，而是直接求解θ 。不需要選擇α ，也不需要做迭代

θ = (X T X) - 1 X T y

有m個observation，n個features，其中

XT 是m*(n+1)的矩陣，就是我們直接看到的那個矩陣！！（注意，看到的並不是X）

x(i)=(x(i)1,(x(i)1,x(i)2,...,x(i)n+1)T 其中

x(i)k 表示第i個樣本的第k個特徵

不適用於特徵特別多（n特別大）的情況 >10000

pinv 和inv在matlab中是求矩陣的逆，但是pinv適用於XTX 不可求逆的情況(singular/degenerate)。
1. redundant feature(linear dependent) 特徵之間有線性關係 —>刪特徵
2. too many features (m<=n) 特徵比樣本多 —-> 刪特徵或者 regularization

tjl_moby

發佈了33 篇原創文章 · 獲贊 2 · 訪問量 8927

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

coursera ML筆記 ----week2 多變量的線性迴歸

PDManer [元數建模]-v4.9.0 發佈：一款簡單好用的數據庫建模平臺

使用neovim打造go ide(支持代碼跳轉, 代碼補全, 實時語法檢查)

sql求連續值問題

cs01 CSS Syntax

挑戰程序設計競賽 2.3章習題 poj 3046 Ant Counting

[MASM拾遺]Offset僞指令

h30 HTML Layout Elements

瞭解顯卡

一款基於C#開發的通訊調試工具（支持Modbus RTU、MQTT調試）

Linux/Golang/glibC系統調用

Coursera ML筆記 -----week3 Logistic Regression

Coursera ML筆記 -----week4 Neural Network -1

Coursera ML筆記 -----week5 Neural Network，Back Propagation

概率論2---參數估計

Coursera ML筆記 -----week9-1 異常檢測

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結