作業內容:
研究用電高峯時居民家庭每小時的用電量Y 與每月總用電量X之間的關係。53戶居民某
月用電記錄見\3-15.xlsx",試完成以下統計分析:(1) 應用最小二乘法求經驗迴歸方程;
(2) 以擬合值^yi爲橫座標,學生化殘差ri爲縱座標,作殘差圖,分析Gauss-Markov假設對
本例的適用性;
(3) 考慮因變量的變換U = sqrt(Y),再對新變量U和X重複(1)和(2)的統計分析;
(4) 將Box-Cox變換應用到本例,計算變換參數¸的值,並做討論;
(5) 做影響分析,找出強影響點。
數據內容:
我的答案(僅供參考)
1、
A<-read.csv("3-15.csv")
lm.reg<-lm(Y~X,data=A)
#Coefficients:
#(Intercept) X
# -0.788008 0.003619
2、
y.stu<-rstudent(lm.reg)
y.fit<-predict(lm.reg)
plot(y.stu~y.fit)
#主差齊性不成立
par(mfrow=c(2,2))
plot(lm.reg)
3、
lm.new<-update(lm.reg,sqrt(.)~.)
summary(lm.new)
#Coefficients:
#(Intercept) X
# 0.5895689 0.0009396
par(mfrow=c(1,1))
y.stu<-rstudent(lm.new)
y.fit<-predict(lm.new)
plot(y.stu~y.fit)
par(mfrow=c(2,2))
plot(lm.new)
結論:在作了開方變換後,殘差表現爲在y=0附近波動,具有齊方差性。我們也可以進一步猜想:使用box-cox變換lambda的取值也該在0.5附近
4、
library(MASS)
par(mfrow=c(1,1))
boxcox(lm.reg,lambda = seq(-1, 1, length = 50))
which.max(box$y)
#77
box$x[77]
#0.5353535
這裏可以看到lambda的取值約爲0.535,爲了使得變換好解釋,可調整爲lambda=0.5
5、
cook<-cooks.distance(lm.reg)
cook[cook>4/53]
# 8 50 52
#0.08098912 0.80377856 0.17563786
用cook距離得到強影響點應該爲8,50,52
可以看看去掉一組數據後的迴歸係數來感受異常點帶來的影響:
lm.influence(lm.reg)
部分輸出結果:
$coefficients
(Intercept) X
1 -0.0393853151 1.920996e-05
2 0.0114405833 -6.915937e-06
3 -0.0625231265 1.548502e-05
4 -0.0113553157 6.299241e-06
5 0.0692992606 -3.644878e-05
6 0.0047731233 -5.493597e-08
7 0.0531184053 -1.407280e-05
8 -0.0852683125 1.145997e-04
9 0.0487118877 -6.198858e-06
10 -0.0035146664 5.067403e-06
11 -0.0007546488 1.483751e-06
12 0.0013770422 -3.764625e-06
13 0.0548807287 -2.498762e-05
14 0.0573408813 -8.586983e-05
15 0.0118615907 -4.364976e-05
16 -0.0125293336 7.222393e-06
17 -0.0203839572 1.204634e-05
18 -0.0258254894 -1.006395e-05
19 -0.0469030468 2.140383e-05
20 0.0352863810 -2.014768e-05
21 -0.0318094556 1.718305e-05
22 -0.0279490278 1.052911e-05
23 -0.0003255986 8.358252e-06
24 -0.0599760416 1.360578e-05
25 0.0956672991 -4.531033e-05
26 -0.0205658103 -5.027818e-05
27 0.0710783963 -2.861559e-05
28 0.0075753364 -1.758391e-05
29 0.0377033247 -7.233015e-05
30 0.0170906336 3.846450e-05
31 -0.0161089291 -4.739595e-06
32 0.0085313955 -1.833973e-05
33 0.0024324183 -1.428421e-06
34 -0.0260055242 3.292257e-05
35 0.0310397481 -2.071044e-06
36 -0.0214490818 1.208351e-05
37 -0.0102999208 4.563105e-06
38 0.0960712852 -4.485485e-05
39 0.0682516943 -2.873485e-05
40 -0.0430904920 1.860305e-05
41 0.0487545927 -2.124459e-05
42 -0.0144921536 8.383218e-06
43 -0.0070021436 -1.695181e-06
44 0.0251347390 -1.248541e-05
45 -0.0020539756 4.795485e-06
46 -0.0150137050 8.437032e-06
47 -0.0291206624 2.832585e-06
48 -0.0117284902 6.763746e-06
49 -0.0361061581 7.580521e-05
50 -0.4056284728 4.129234e-04
51 0.0008991617 7.352304e-06
52 0.1288033831 -1.702306e-04
53 -0.0001762253 -1.324578e-05