程序员的自我修养之数学基础11:期望、方差、常见分布(均匀分布、二项分布、泊松分布、正态分布)

目录

一、期望

1. 离散型随机变量的期望

2. 连续型随机变量的期望

3. 期望的性质

二、方差和均方差

1. 定义

2. 计算

三、常见分布

1. 均匀分布

2. 二项分布和几何分布

3. 泊松分布

4. 正态分布


一、期望

期望这个概念,初高中就学过了吧,所以这里就简单说一下定义。

1. 离散型随机变量的期望

\bg_white E(X)=\sum_{k=1}^{n}x_kp_k

2. 连续型随机变量的期望

\bg_white E(X)=\int_{-\infty}^{+\infty}xf(x)dx

3. 期望的性质

  • E(cX)=xE(x)
  • E(X+Y)=E(x)+E(Y)
  • X,Y独立时,E(XY)=E(X)E(Y)

二、方差和均方差

1. 定义

方差,主要用于研究随机变量与其均值的偏离程度:

D(X)=E[X-E(X)]^2

均方差又称标准差:

\sigma (X)=\sqrt{D(X)}=\sqrt{E[X-E(X)]^2}

2. 计算

设 g(X)=E[X-E(X)]^2,那么,方差,就相当于g(X)的期望。

因此,对于离散型随机变量,有:

D(X)=\sum_{k=1}^{n}[x_k-E(X)]^2p_k

对于连续型随机变量,有:

D(X)=\int_{-\infty }^{+\infty }[x_k-E(X)]^2f(x)dx

3. 性质

  • 若c为常数,则D(C)=0
  • 若X是随机变量,C是常数,则有 D(CX)=C^2D(X)D(X+C)=D(X)
  • 若X,Y是连个随机变量,则有D(X+Y)=D(X)+D(Y)+2E{(X-E(X))(Y-E(Y))}
  • 若X,Y相互独立,则有D(X+Y)=D(X)+D(Y)

三、常见分布

1. 均匀分布

这个太简单了,我都不想说了……

函数定义

概率分布图像: 

这里写图片描述

 关于均匀分布,我们还需要知道:

  • 期望:\bg_white E(x)=\frac{a+b}{2}
  • 方差:\bg_white D(x)=\frac{(b-a)^2}{12}

2. 二项分布和几何分布

二项,二项,为啥叫二项分布呢?顾名思义,就是这个随机事件只有两种可能的结果,也就是所谓的“不成功便成仁”,因此,二项分布也被称为0-1分布。

二项分布必须满足下面4个特点:一是某件事情发生的次数(试验次数)是固定的,一般用n来表示;二是每件事情都有两个可能的结果(成功或失败);三是每一次试验中成功的概率都是相等的,一般用p来表示;四是我们感兴趣的是成功x次的概率问题,也就是在n次试验中x次的结果为成功的概率

二次分布的公式如下:

p(x)=C_n^x p^x (1-p)^{n-x}

关于二次分布,你还要知道:

  • 期望E(x)=np(表示事情发生n次预计成功多少次)
  • 标准差\sigma (x)=\sqrt{np(1-p)}(表示数据的波动大小)

几何分布和二项分布兼职就是“海尔兄弟”。几何分布也需要满足4个特点,前三个和二次分布完全一样,不同的是,在几何分布问题中,我们感兴趣的是,在第x次试验中取得第一次成功的概率有多大。举个例子,同样是抛硬币,抛5次,二项分布可能关注,5次试验中3次结果为朝上的概率,而几何分布中,我们关注的是“只有第五次正面朝上的概率”,也就是说,前四次均失败但第五次成功的概率。

几何分布的公式是这个样子的:

\bg_white p(x)=(1-p)^{x-1}p

几何分布的期望\bg_white E(x)=\frac{1}{p},标准差\sigma (x)=\frac{1-p}{p^2}

3. 泊松分布

泊松分布(Poisson Distribution),一般用于描述在连续时间和空间单位上随机事件的概率,也就是说,我们可以基于已有的经验,预测该随机事件在新的同样长的时间里或同样大的空间中发生N次的概率。比如,机器在一定时间内故障的次数、汽车站台在一定时间内的候车人数、某地区自然灾害发生的次数等等。

泊松分布需要满足以下三个特点:

1)在给定区间内(可以是时间或者空间),事件是独立事件

2)在任意相同的时间范围内,事件发生的次数(概率)相同,一般用\lambda 表示该区间内事件的平均发生次数;

3)我们关注的是某个区间内,事件发生x次的概率。

Poisson分布的概率函数为:

在这里,我们用到了指数函数e^{-\lambda},这里的e是自然对数(ln)的底数,e\approx 2.718281828

泊松分布的期望\bg_white E(x)=\lambda,方差为\sigma (x)=\lambda

在二项分布的p很小的时候,泊松分布和二次分布较为接近。

4. 正态分布

正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

正态分布的图像,就是著名的“钟形曲线”,如下图所示:

正态分布的期望\bg_white E(x)=\mu,方差\bg_white D(x)=\sigma ^2。若随机变量X服从正态分布,记为X\sim N(\mu ,\sigma ^2)。正态分布的概率密度函数为:

我们常说的标准正态分布,是指未知参数 \mu=0,尺度参数\sigma ^2=1的正态分布。其表达式可以简化为:

正态分布具有许多独特的性质:

  • 密度函数关于平均值(即\mu、位置参数、期望)对称
  • 平均值=众数=中位数

 

参考:

http://www.360doc.com/content/17/1231/22/9200790_718001949.shtml

https://blog.csdn.net/ccnt_2012/article/details/81327881

https://blog.csdn.net/qq_23869697/article/details/80610361

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章