【文末有福利】连续型随机变量及实例详解

原創

osc_cgh49c55

2021-02-05 21:23

如果随机变量X的所有可能取值不可以逐个列举出来，而是取数轴上某一区间内的任意点，那么称之为连续型随机变量。例如，一批电子元件的寿命、实际中常遇到的测量误差等都是连续型随机变量。

>>>>

连续型随机变量X无法像离散型随机变量一样，给出其取每一个点时的概率,那么换一种思路，来研究随机变量落入一个区间的概率 ,当区间接近无穷小时，这时我们使用概率密度来表示概率值。什么是概率密度？

假设有一组零件，由于各种因素的影响，其长度是各不相同的。具体数值如下。

[171.671,172.04,171.67,172.40,172.70,172.164,171.71,172.68,172.13,171.97,172.266,171.81,172.15,172.45,172.20,172.600,172.24,171.39,172.17,171.2]

按前面离散型随机变量的思路，要将数据分组，对应每个组计算出其相应的概率值，并绘制概率分布直方图，如下图所示。

连续型随机变量分组后的概率分布直方图

图中的横座标是随机变量值，纵座标是随机变量落入该值范围内的概率。直方图的边缘看起来有点粗糙，但当我们把样本数据和分组数同时增加时，轮廓就会越来越细致，接近于如图所示的曲线，这条曲线对应的函数就称为概率密度函数。由此思路，得到概率密度的数学描述如下。

考虑连续随机变量落入区间区间的概率，由概率分布函数的定义可知，令，则设

如果该极限存在，则称为在点处的概率密度。

概率密度反映出概率在点处的密集程度，可以设想一根的质量不均匀的金属杆，总质量为1，概率密度相当于杆上各点处的质量密度。

根据导数的定义可知：

从上式中可得结论：若在处连续，则概率密度函数是分布函数的导函数。

设为连续型随机变量，在任意区间(a,b]上的概率可以表示为：

其中就叫作X的概率密度函数。

下图形象描绘出概率密度函数和概率之间的关系。概率被看成曲线下的面积，用数学公式描述就是一个积分形式。

概率密度函数和概率P

连续型随机变量X的分布函数，也可写成：

概率密度函数和分布函数具有以下性质。

（1）非负函数：。

（2）规范性：。

（3）对于任何常数a<b，有：

假设某零件误差量在区间(－4,4)均匀分布，计算误差量为1~3的概率。

解：设随机抽取一个零件的误差量为X，随机变量X在区间(－4,4)上均匀分布，X落在该区间任意点的概率相同，即概率密度为一常量。

设，，即

可得：概率密度函数其他

在区间[1,3]之间的概率。

下图中显示均匀分布对应的概率密度函数和分布函数。

均匀分布对应的概率密度函数和分布函数

在Python中输出正态分布概率密度函数和对应的概率分布函数。

解：如果一个随机变量X具有概率密度函数

则称随机变量X为正态分布随机变量，并记为。

下面代码模拟实现了一个均值为0和方差σ²为1的正态分布。

【代码如下】

import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
def test_norm_pmf():
# 正态分布是一种连续分布，其函数可以在实线上的任何地方取值
# 正态分布由两个参数描述：分布的平均值μ和方差σ2 
mu = 0 # mean
sigma = 1#standard deviation
x = np.arange(－5,5,0.1)     #生成随机数x
#得到对应的概率值y
y = (1/(np.sqrt(2*np.pi*sigma*sigma)))*np.exp(－(((x－mu)**2)/(2*sigma*sigma)))
fig, (ax0, ax1) = plt.subplots(ncols=2, figsize=(10, 5))
ax0.plot(x, y)
ax1.plot(x,stats.norm.cdf(x,0,1))
ax0.set_title('Normal: $\mu$=%.1f, $\sigma^2$=%.1f' % (mu,sigma))
ax0.set_xlabel('x')
ax0.set_ylabel('Probability density', fontsize=15)
ax1.set_title('Normal: $\mu$=%.1f, $\sigma^2$=%.1f' % (mu, sigma))
ax1.set_xlabel('x')
ax1.set_ylabel('Cumulative density', fontsize=15)
fig.subplots_adjust(wspace=0.4)
plt.show()
test_norm_pmf()

【运行结果】

如下图所示。

正态分布对应的概率密度函数和分布函数

自然界中许多随机指标都服从一种“中间高，两头低”的概率特性。例如，一门课程的考试成绩，人的身高、体重等。

正态分布这种“钟形曲线”很好地反映了现实世界中的中间高、两头低的随机现象。

【文末有福利】连续型随机变量及实例详解

Spring Cloud 部署时如何使用 Kubernetes 作为注册中心和配置中心

LAMP環境下部署phpMyadmin工具

【文末有福利】連續型隨機變量及實例詳解

（14）Flutter FloatingActionButton

很多人已經學會了應對恐懼和焦慮的祕訣

每天一道 python 面試題 - Python中的元類(metaclass) 詳細版本

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結