原创 迴歸分析作業3

作業內容: 研究用電高峯時居民家庭每小時的用電量Y 與每月總用電量X之間的關係。53戶居民某 月用電記錄見\3-15.xlsx",試完成以下統計分析: (1) 應用最小二乘法求經驗迴歸方程; (2) 以擬合值^yi爲橫座標,學生化殘差ri

原创 R語言與機器學習學習筆記(分類算法)(1)K-近鄰算法

前言      最近在學習數據挖掘,對數據挖掘中的算法比較感興趣,打算整理分享一下學習情況,順便利用R來實現一下數據挖掘算法。      數據挖掘裏我打算整理的內容有:分類,聚類分析,關聯分析,異常檢測四大部分。其中分類算法主要介紹:K-

原创 優化與求解非線性方程組(單變量問題)

        求函數極值的問題通常被化簡爲求解導數爲0的點的問題。所以優化問題通常與解非線性方程組聯繫起來。在前面寫點估計中的mle時,我們介紹了R中求解方程極值的函數nlm(),optim().          我們以一元函數f(x

原创 兩道概率題求解(半原創)

問題:任意投n個點在圓周上,問它們同時落在一個半圓上的概率是多少?   解: 用O表圓心,從投下的n個點中,任取一個點作起點,順時針方向進行編號爲P1,P2,. . .  P n ,過P1,P2 . . . P n作n條半徑,用

原创 R語言與迴歸分析學習筆記(應用迴歸小結)(2)

三、異常點         所謂的異常點一般指有着很大殘差(絕對值)的點,如果對模型的參數估計值影響出現了比例失衡,那麼我們稱之爲強影響點。爲了說明異常點與強影響點的判別,我們特意採用模擬的數據來證實它。        爲了簡單起見,我們

原创 R語言與顯著性檢驗學習筆記

一、何爲顯著性檢驗        顯著性檢驗的思想十分的簡單,就是認爲小概率事件不可能發生。雖然概率論中我們一直強調小概率事件必然發生,但顯著性檢驗還是相信了小概率事件在我做的這一次檢驗中沒有發生。       顯著性檢驗即用於實驗處理

原创 R語言與非參數統計(核密度估計)

R語言與非參數統計(核密度估計) 核密度估計是在概率論中用來估計未知的密度函數,屬於非參數檢驗方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。

原创 迴歸分析作業4

作業內容: 數據: y x1 x2 x3 x4 x5 271.8 783.35 33.53 40.55 16.66 13.2 264 748.45 36.5 36.19 16.46 14.11 238.8 684.45 34.66 3

原创 R語言與迴歸分析學習筆記(應用迴歸小結)(1)

         迴歸分析是計量與統計的一個核心話題。我的博客在這篇之前也寫過兩篇關於迴歸的文章:《R 語言與簡單的迴歸分析》、《R語言與迴歸分析幾個假設的檢驗》。後者很清楚的告訴了我們迴歸模型假設的嚴苛:響應變量不僅需要數值型的,而且還

原创 Study note on Applied Econometrics with R(1)

           這是我根據Applied Econometrics with R(springer)一書中線性迴歸(第三章)有關內容整理成的學習筆記,對書中的一些代碼進行了解讀,也根據我學到的迴歸知識添加了部分內容。筆記中的例子凡是

原创 多變量非線性方程求解問題(牛頓迭代法)

        關於多變量的多元函數,我們求解考慮解的問題與單變量是極其類似的。考慮在x處的一階泰勒展開,我們有0=f(x0)=f(x)+j(x)(x-x0)(後面的等號近似成立,j表示jacobian矩陣.        我們以一個例題

原创 用R做個帶鬧鈴功能的鐘

一個很有意思的小東西。t爲鬧鈴運行時間,單位是秒,我們可以寫一個簡單的轉換程序來使得t變爲輸入格式爲hour:minute:second。 原帖地址:http://bbs.pinggu.org/thread-2266932-1-1.htm

原创 迴歸分析作業1

作業內容: 1、重現《線性統計模型》(王鬆桂等)例3.1.3 2、模擬最小二乘法,並根據模擬結果得出估計係數與估計方差的一些結論,如無偏性等 作業實現(僅供參考) #1 y<-c(10.98,11.13,12.51,8.40,9.27,

原创 迴歸分析作業5

作業內容: 完成《線性統計模型》(王鬆桂等)習題6.4,6.6,6.9 參考實現(use R) battery<-data.frame( X=c(40,48,38,42,45,46,26,34,30,28,32,33,39,40,48,

原创 R語言與數據的預處理

         在面對大規模數據時,對數據預處理,獲取基本信息是十分必要的。今天分享的就是數據預處理的一些東西。 一、獲取重要數據           在導入大規模數據時,我們通常需要知道數據中的關鍵內容:最值,均值,離差,分位數,原點