核光滑方法

注意：這裏將的核函數和講希爾伯特空間提到的核函數不是一回事，這裏的核函數僅僅作爲一種局部化的表示工具。而另一種核函數是在高維空間內計算內積，解決非線性問題的。

基本思想是使用靠近目標點x0 處的點來生成預測模型。
我們通常使用權重函數或者核數Kλ(x0,xi) ，來達到函數光滑的效果。這兩種方法都是參考xi到x0 的距離，給xi 賦予一個權重。越靠近x0 的權重越大，對x0 的預測值的影響越大。

注：核函數Kλ 使用λ 來索引，λ 代表鄰域的寬度

這種方法還可以稱爲memory−based methods ，大意就是說模型其實就是數據集本身，在預測的時候完成訓練。

一維空間

圖中:k近鄰方法，(xi,yi) ,i=1,…,100,K=30。
左圖直接使用平均數預測y0 ，可以發現左圖的平均數是不光滑，不連續的。爲了解決這種問題，我們給參與預測的 yi 賦上權重。

Nadaraya−Watson kernel−weighted average

$f (x 0) = \sum N i = 1 K λ ( x 0 , x i ) y i \sum N i = 1 K λ ( x 0 , x i ) K λ (x 0, x) = D (| x - x 0 | λ)$
$D (t) = ⎧ ⎩ ⎨ 3 4 (1 - t 2), | t | \leq 1 0, o t h e r$

通過上面的方法就能得到右圖。

直觀的理解就是：假設我們將x0 從左向右移動，剛進入鄰域的點的權值爲0，慢慢增大。權重作用的區域是通過λ 來調節。

爲了使上述核函數更有一般性，我們可以使用hλ(x0) 來表示寬度函數(之前我們使用λ 來表示寬度)：

$K λ (x 0, x) = D (| x - x 0 | h λ ( x 0 ))$

hλ(x0) 在KNN裏面就是x0 近鄰個數k

上面的例子裏hλ 就是λ

局部線性迴歸

通過使用核權重的方法，我們可以獲得光滑的曲線
。但是，核函數不具有對稱性，因此，當x0 處於邊界
位置的時候，預測會出現問題。如圖顯示的紅色點。
我們可以使用局部線性迴歸：

m i n α (x 0), β (x 0) \sum i = 1 N K λ (x o, x i) [y i - α (x 0) - β (x 0) x i] 2 f^(x 0) = α^(x 0) + β^(x 0) x 0

注:
我們可以換一種形式來寫預測函數:
f^(x0)=α^x0+β^x0x0 ，也就是說 α^(x0)和β^(x0) 是預測函數的係數，它們不是x0 的函數。

我們可以顯示地給出預測函數:

f^(x 0) = b (x 0) T (B T W (x 0) B) - 1 B T W (x 0) y = \sum i = 1 N l i (x o) y i

b(x)T=(1,x)

B∈RN×N,Bi=b(xi)T

W∈RN×N,Wi=Kλ(x0,xi)

注：這式子怎麼推導我沒想出來，但是和線性迴歸裏的函數挺像的:

$y^= X β^= X (X T X) - 1 X T y$
b(x0) → X

BT → BTW(x0)

通過這個式子，我們可以發現預測函數是關於yi 的線性函數。

模型bias分析

$E f^(x 0) = \sum i = 1 N l i (x 0) f (x i) = f (x 0) \sum i = 1 N l i (x 0) + f' (x 0) \sum i = 1 N (x i - x 0) l i (x 0) + f '' ( x 0 ) 2 \sum i = 1 N (x i - x 0) 2 l i (x 0) + R$
又因爲
$b (x 0) T = b (x 0) T (B T W (x 0) B) - 1 B T W (x 0) B (1, x 0) = b (x 0) T (B T W (x 0) B) - 1 B T W (x 0) [1, x 0]$
所以
$⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 1 x 0 = b (x 0) T (B T W (x 0) B) - 1 B T W (x 0) 1 = \sum i = 1 N l i (x 0) = b (x 0) T (B T W (x 0) B) - 1 B T W (x 0) x 0 = \sum i = 1 N l i (x 0) x i$
所以
$\sum i = 1 N l i (x 0) = 1 \sum i = 1 N (x i - x 0) l i (x 0) = 0$
所以
$b i a s = E f^(x 0) - f^(x 0) = f '' ( x 0 ) 2 \sum i = 1 N (x i - x 0) 2 l i (x 0) + R$
所以我們可以看到bias 依賴於二階及以上導數。

局部多項式迴歸

多項式迴歸的表達形式如下：

m i n α (x 0), β (x 0), j = 1, . ., d \sum i = 1 N K λ (x 0, x i) [y i - α (x 0) - \sum j = 1 d β j (x 0) x j i] 2

v a r (f^(x 0)) = E [f^2 (x 0)] - [E [f^(x 0)]] 2 = σ 2 | | l (x 0) | | 2

|||l(x0)| 隨着維度

d 增大而增大。

部分證明參考: 習題答案

一維空間

局部線性迴歸

模型bias分析

局部多項式迴歸

前端使用 Konva 實現可視化設計器（13）- 折線 - 最優路徑應用【思路篇】

文本摘要

筆記本加裝固態硬盤，安裝Ubuntu

USACO-wormhole

USACO-dualpal

USACO-transform

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結