原创 插值法(轉自wiki)

多項式可以根據少數給定的數據點來逼近複雜的曲線,如字體排印學中的文字。一個相關的應用是估計自然對數和三角函數的值:選擇幾個已知的數據點、構建一個查找表、然後在這些數據點之間進行插值。這樣可以得到非常快速的計算。另外多項式插值也是數值積分

原创 深入理解彙編語言和c++語言(1)---從a+b說起

最近突然對c語言,以及c語言如何轉換到彙編語言特別的感興趣,於是寫了這個系列,首先讓我們看一個小程序: using namespace std; int main(){ int s; int a=3; int b=4; s=a+b;

原创 機器學習-學習筆記3.1-局部加權迴歸

局部加權緊接着上面的線性迴歸中參數求解來繼續講吧。還是以上面的房屋價格的預測,它的中心思想是在對參數進行求解的過程中,每個樣本對當前參數值的影響是有不一樣的權重的。比如上節中我們的迴歸方程爲(這個地方用矩陣的方法來表示Ɵ表示參數,i表示

原创 在Docker Container中運行Hadoop程序

   Hadoop 自從2.7.1 之後開始支持 Docker Container Executor,   這就爲我們運行mapreduce 任何提供了一個新的可能,也就是說我們可以把mapreduce 任務的JVM 運行在docker裏

原创 正則化最小二乘

正則化的最小二乘法 在機器學習或者模式識別中,會出現overfitting,而當網絡逐漸overfitting時網絡權值逐漸變大,因此,爲了避免出現overfitting,會給誤差函數添加一個懲罰項,常用的懲罰項是所有權重的平

原创 偏差-方差分解 Bias-Variance Decomposition

設希望估計的真實函數爲 f=f(X) 但是觀察值會帶上噪聲,通常認爲其均值爲0 Y=f(X)+ϵ,E[ϵ]=0 假如現在觀測到一組用來訓練的數據 D={(x1,y1),(x2,y2),...,(xN,yN)} 那麼