MATLAB數據統計和分析:常用統計量和隨機數生成

常用統計量和隨機數生成




常用統計量

1. 平均值

1. mean(X)
2. mean(A)
3. mean(A,dim)
  1. X 爲向量,返回 X 中各元素平均值
  2. A 爲矩陣,返回 A 中各列元素的平均值所構成的向量
  3. 在給出的維度內的中位數

2. 中位數

1. median(X)
2. median(A
3. median(A,dim)
  1. X 爲向量,返回 X 中各元素中位數
  2. A 爲矩陣,返回 A 中各列元素的中位數所構成的向量
  3. 求給出的維度內的中位數

3. 標準差、方差和極差

1. D = var(X)
2. D = var(A
3. D = var(X,1)
4. D = var(X,w)
  1. 若 X 爲向量,則返回向量的樣本方差。
  2. 若 A 爲矩陣,則返回 A 的列向量的樣本方差構成的行向量。
  3. 返回向量 X 的簡單方差。
  4. 返回向量 X 的以 w 爲權重的方差。
 1. std(X)
 2. std(x,1)
 3. std(x,flag,dim)
  1. 返回向量 X 的樣本標準差。
  2. 返回向量的標準差。
  3. 返回向量中維數爲 dimdim 的標準差值,其中 flag=0flag = 0 時置前因子爲 1/(n1)1/(n-1); 否則置前因子爲 1/n1/n.

4. 偏度和峯度

偏度:
g1=1s3i=1n(XiX)3g_{1} = \frac{1}{s^{3}}\sum^{n}_{i = 1}(X_{i} - \overline{X})^{3}

峯度:
g2=1s4i=1n(XiX)4g_{2} = \frac{1}{s^{4}}\sum^{n}_{i = 1}(X_{i} - \overline{X})^{4}

偏度是反映數據對稱性的量。g1>0g_{1}>0 稱爲 右偏態 ,此時數據位於均值右邊的比位於左邊的多;g1<0g_{1}<0 稱爲 左偏態 ,所反映的情況相反。 g1g_{1} 接近於 00 ,則可認爲數據是對稱的.

峯度是反映數據分佈形狀的量:正態分佈的峯度爲 33 ,若 g2g_{2}33 大很多,表示樣本中有較多遠離均值的數據,分佈有沉重的尾巴。因此,峯度可用於衡量偏離正態分佈的尺度.

峯度-偏度檢驗又稱爲 JarqueBeraJarque-Bera 檢驗,該檢驗基於數據樣本的偏度和峯度,評價給定數據是否服從未知均值和方差的正態分佈的假設。對於正態分佈數據,樣本偏度接近於 00 ,樣本峯度接近於 33.


MATLABMATLAB 中,我們使用 jbtestjbtest 函數進行 JarqueBeraJarque-Bera 檢驗,測試數據對正態分佈的似合程度:

1. h = jbtest(X)
2. h = jbtest(X,alpha)
3. [H,P,JBSTAT,CV] = jbtest(X,alpha)
  1. 對輸入數據向量 X 進行 JarqueBeraJarque-Bera 檢驗,返回檢驗結果 hh. 若 h=1h = 1,則在顯著性水平 0.050.05 下拒絕 XX 服從正態分佈的假設,若 h=0h = 0,則可認爲 XX 服從正態分佈。
  2. 在顯著性水平 alphaalpha 下進行 JarqueBeraJarque-Bera 檢驗。
  3. 函數同時返回三個其他輸出: PP 爲檢驗的 pp 值,JBSTATJBSTAT 爲檢驗統計量,CVCV 爲確定是否拒絕零假設的臨界值。

隨機數

下面介紹幾種常用的隨機數生成方法:

1 二項分佈隨機數

在概率論和統計學中,二項分佈指 nn 個獨立的是/非試驗中成功的次數的離散概率分佈,其中沒次試驗成功的概率爲 pp. 這樣的單次成功/失敗試驗又稱爲 BernoulliBernoulli 試驗。

MATLABMATLAB 中,我們使用 binorndbinornd 函數產生二項分佈隨機數:

1. R = binornd(N,P)
2. R = binornd(N,P,m)
3. R = binornd(N,P,m,n)
  1. N,PN,P 爲二項分佈的兩個參數,返回服從參數爲 N,PN,P 的二項分佈的隨機數,且 N,P,RN,P,R 的形式相同。
  2. mm 是一個 1x21x2 向量,它爲指定隨機數的個數。其中 N,PN,P 分別代表返回值 RR 中行與列的維數。
  3. m,nm,n 分別表示 RR 的行數和列數。

2 PoissonPoisson 分佈隨機數

PoissonPoisson 分佈表達式爲:
f(xλ)=λxx!eλ,   x=0,1,,.f(x|\lambda) = \frac{\lambda^{x}}{x!}e^{-\lambda}, \ \ \ x = 0,1,\cdots, \infty.

MATLABMATLAB 中,我們使用 poisspdfpoisspdf 函數獲取 PoissonPoisson 分佈隨機數:

y = poisspdf(x,Labmda)

求取參數爲 LambdaLambdaPoissonPoisson 分佈的概率密度函數值。


3 均勻分佈隨機數

MATLABMATLAB 中,我們使用 unifrndunifrnd 函數獲取均勻分佈隨機數:

1. R = unifrnd(A,B)
2. R = unifrnd(A,B,m,n,……)
  1. 生成被 AABB 指定上下端點 [A,B][A,B] 的連續均勻分佈的隨機數組 RR .若 A,BA,B 是數組,R(i,j)R(i,j) 是生成的被 A,BA,B 對應元素指定連續均勻分佈的隨機數。若 NNPP 是標量,則被擴展爲和另一個輸入有相同維度的數組。
  2. 返回 mnm * n*\cdots 數組。若 AABB 是標量, RR 中所有元素是相同分佈產生的隨機數。若 AABB 是數組,則必須是 mnm * n * \cdots 數組。

4 正態分佈隨機數

MATLABMATLAB 中提供正態分佈函數 normrndnormrnd

1. R = normrnd(mu,sigma)
2. R = normrnd(mu,sigma,m,n,……)
  1. 返回均值爲 mumu ,標準差爲 sigmasigma 的正態分佈的隨機數據,RR 可以是向量或矩陣。
  2. m,nm,n 分別表示 RR 的行數和列數。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章