MATLAB数据统计和分析:常用统计量和随机数生成

常用统计量和随机数生成




常用统计量

1. 平均值

1. mean(X)
2. mean(A)
3. mean(A,dim)
  1. X 为向量,返回 X 中各元素平均值
  2. A 为矩阵,返回 A 中各列元素的平均值所构成的向量
  3. 在给出的维度内的中位数

2. 中位数

1. median(X)
2. median(A
3. median(A,dim)
  1. X 为向量,返回 X 中各元素中位数
  2. A 为矩阵,返回 A 中各列元素的中位数所构成的向量
  3. 求给出的维度内的中位数

3. 标准差、方差和极差

1. D = var(X)
2. D = var(A
3. D = var(X,1)
4. D = var(X,w)
  1. 若 X 为向量,则返回向量的样本方差。
  2. 若 A 为矩阵,则返回 A 的列向量的样本方差构成的行向量。
  3. 返回向量 X 的简单方差。
  4. 返回向量 X 的以 w 为权重的方差。
 1. std(X)
 2. std(x,1)
 3. std(x,flag,dim)
  1. 返回向量 X 的样本标准差。
  2. 返回向量的标准差。
  3. 返回向量中维数为 dimdim 的标准差值,其中 flag=0flag = 0 时置前因子为 1/(n1)1/(n-1); 否则置前因子为 1/n1/n.

4. 偏度和峰度

偏度:
g1=1s3i=1n(XiX)3g_{1} = \frac{1}{s^{3}}\sum^{n}_{i = 1}(X_{i} - \overline{X})^{3}

峰度:
g2=1s4i=1n(XiX)4g_{2} = \frac{1}{s^{4}}\sum^{n}_{i = 1}(X_{i} - \overline{X})^{4}

偏度是反映数据对称性的量。g1>0g_{1}>0 称为 右偏态 ,此时数据位于均值右边的比位于左边的多;g1<0g_{1}<0 称为 左偏态 ,所反映的情况相反。 g1g_{1} 接近于 00 ,则可认为数据是对称的.

峰度是反映数据分布形状的量:正态分布的峰度为 33 ,若 g2g_{2}33 大很多,表示样本中有较多远离均值的数据,分布有沉重的尾巴。因此,峰度可用于衡量偏离正态分布的尺度.

峰度-偏度检验又称为 JarqueBeraJarque-Bera 检验,该检验基于数据样本的偏度和峰度,评价给定数据是否服从未知均值和方差的正态分布的假设。对于正态分布数据,样本偏度接近于 00 ,样本峰度接近于 33.


MATLABMATLAB 中,我们使用 jbtestjbtest 函数进行 JarqueBeraJarque-Bera 检验,测试数据对正态分布的似合程度:

1. h = jbtest(X)
2. h = jbtest(X,alpha)
3. [H,P,JBSTAT,CV] = jbtest(X,alpha)
  1. 对输入数据向量 X 进行 JarqueBeraJarque-Bera 检验,返回检验结果 hh. 若 h=1h = 1,则在显著性水平 0.050.05 下拒绝 XX 服从正态分布的假设,若 h=0h = 0,则可认为 XX 服从正态分布。
  2. 在显著性水平 alphaalpha 下进行 JarqueBeraJarque-Bera 检验。
  3. 函数同时返回三个其他输出: PP 为检验的 pp 值,JBSTATJBSTAT 为检验统计量,CVCV 为确定是否拒绝零假设的临界值。

随机数

下面介绍几种常用的随机数生成方法:

1 二项分布随机数

在概率论和统计学中,二项分布指 nn 个独立的是/非试验中成功的次数的离散概率分布,其中没次试验成功的概率为 pp. 这样的单次成功/失败试验又称为 BernoulliBernoulli 试验。

MATLABMATLAB 中,我们使用 binorndbinornd 函数产生二项分布随机数:

1. R = binornd(N,P)
2. R = binornd(N,P,m)
3. R = binornd(N,P,m,n)
  1. N,PN,P 为二项分布的两个参数,返回服从参数为 N,PN,P 的二项分布的随机数,且 N,P,RN,P,R 的形式相同。
  2. mm 是一个 1x21x2 向量,它为指定随机数的个数。其中 N,PN,P 分别代表返回值 RR 中行与列的维数。
  3. m,nm,n 分别表示 RR 的行数和列数。

2 PoissonPoisson 分布随机数

PoissonPoisson 分布表达式为:
f(xλ)=λxx!eλ,   x=0,1,,.f(x|\lambda) = \frac{\lambda^{x}}{x!}e^{-\lambda}, \ \ \ x = 0,1,\cdots, \infty.

MATLABMATLAB 中,我们使用 poisspdfpoisspdf 函数获取 PoissonPoisson 分布随机数:

y = poisspdf(x,Labmda)

求取参数为 LambdaLambdaPoissonPoisson 分布的概率密度函数值。


3 均匀分布随机数

MATLABMATLAB 中,我们使用 unifrndunifrnd 函数获取均匀分布随机数:

1. R = unifrnd(A,B)
2. R = unifrnd(A,B,m,n,……)
  1. 生成被 AABB 指定上下端点 [A,B][A,B] 的连续均匀分布的随机数组 RR .若 A,BA,B 是数组,R(i,j)R(i,j) 是生成的被 A,BA,B 对应元素指定连续均匀分布的随机数。若 NNPP 是标量,则被扩展为和另一个输入有相同维度的数组。
  2. 返回 mnm * n*\cdots 数组。若 AABB 是标量, RR 中所有元素是相同分布产生的随机数。若 AABB 是数组,则必须是 mnm * n * \cdots 数组。

4 正态分布随机数

MATLABMATLAB 中提供正态分布函数 normrndnormrnd

1. R = normrnd(mu,sigma)
2. R = normrnd(mu,sigma,m,n,……)
  1. 返回均值为 mumu ,标准差为 sigmasigma 的正态分布的随机数据,RR 可以是向量或矩阵。
  2. m,nm,n 分别表示 RR 的行数和列数。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章