1、說明
實際問題中影響因變量的因素可能很多,我們希望從中挑選出影響顯著的自變量來建立迴歸模型,這就涉及到變量的選擇的問題,逐步迴歸是從衆多變量中有效地選擇重要變量方法。
2、例題
3、求解
clear
clc
x0=[1 7 26 6 60 78.5;
2 1 29 15 52 74.3;
3 11 56 8 20 104.3;
4 11 31 8 47 87.6;
5 7 52 6 33 95.9;
6 11 55 9 22 109.2;
7 3 71 17 6 102.7;
8 1 31 22 44 72.5;
9 2 54 18 22 93.1;
10 21 47 4 26 115.9;
11 1 40 23 34 83.8;
12 11 66 9 12 113.3;
13 10 68 8 12 109.4];
x=x0(:,2:5);
y=x0(:,6);
stepwise(x,y)
4、結果
第一步:
第二步:
第三步:
總結:最後紅色部分表示已經移除爲;
從統計結果可以看出,雖然剩餘標準差s(RMSE)沒有太大的變化,但是統計量F的值明顯增大,因此新的迴歸模型更好一些。可以求出最終的模型爲: