概率论


公理化概率论
概率论的公理化,是20世纪数学抽象化的又一大硕果。
(一)20世纪以前的概率论
[
惠更斯的问题
两人玩掷双骰游戏,骰子的点数和为7时甲赢,为6时乙赢,为其它时两人平分赌注,求两人的期望(机会的价值)。
定义:设离散型r.v.X的分布律为:P{X=x_k}=p_k,k=1,2,…,若级数∑[k=1->∞]|x_k|p_k<+∞,则称级数∑[k=1->∞]x_kp_k的和为随机变量的数学期望,记作E(X),即E(X)= ∑[k=1->∞]x_kp_k。
我们知道随机变量X可能取各种不同的数值,但我们往往希望知道X所取值的大多数集中在何处,能够粗略地反映这种特征的就是数学期望。
定义:设离散型随机变量X的分布律为P{X=x_k}=p_k,k=1,2,…。若级数∑[k=1->∞]x_kp_k绝对收敛,则称级数∑[k=1->∞]x_kp_k的和为随机变量X的数学期望或均值,记为E(X)。
即E(X)=∑[k=1->∞]x_kp_k。若级数∑[k=1->∞]|x_kp_k|发散,则称随机变量X的数学期望不存在。----为什么要用绝对收敛??
设连续型随机变量X的概率密度为f(x),若积分∫[-∞,+∞]xf(x)dx绝对收敛,则称积分∫[-∞,+∞]xf(x)dx的值为随机变量X的数学期望或均值,记为E(X)。即E(X)= ∫[-∞,+∞]xf(x)dx。若积分∫[-∞,+∞]xf(x)dx不绝对收敛,则称随机变量X的数学期望不存在。----为什么要用绝对收敛??
设随机变量X服从柯西分布,其概率密度为f(x)=1/(pi(1+x^2)) ,(-∞<x<+∞),求E(X)= ∫[-∞,+∞](x/(pi(1+x^2)))dx
由于广义积分∫[-∞,+∞](|x|/(pi(1+x^2)))dx发散(即不绝对收敛),所以E(X)不存在。

概率论起源于博弈问题。15-16世纪意大利数学家帕乔利(L.Pacioli)、塔塔利亚和卡尔丹的著作中曾讨论过“如果两人赌博提前结束,该如何分配赌金”等概率问题。1654年左右,费马与帕斯卡在一系列通信中讨论类似的合理分配赌金问题,并用组合方法给出正确解答。他们的通信引起了荷兰数学家惠更斯的兴趣,后者在1657年发表的《论赌博中的计算》是最早的概率论著作。这些数学家的著述中所出现的第一批概率论概论(如数学期望)与定理(如概率加法、乘法定理),标志着概率论的诞生。但他们主要是以代数方法计算概率。
[
条件概率的定义
设A,B是两个事件,且P(A)>0,称P(B|A)=P(AB)/P(A)为在事件A发生的条件下事件B发生的条件概率。
乘法定理
设P(A)>0,则有P(AB)=P(B|A)P(A)。
上式被称为乘法公式。它可由条件概率的公式直接推得。
同理,若P(B)>0,则有P(AB)=P(A|B)P(B)。
]一般认为,概率论作为一门独立数学分支,其真正的奠基人是雅各布·伯努利,他在遗著《猜测述》(Ars Conjectandi,1713)中首次提出了后来以“伯努利定理”著称的极限定理:若在一系列独立试验中,事件A发生的概率为常数且等于p,那么对¥ε>0以及充分大的试验次数n,有P{|(m/n-p)|<ε}>1-η(η为任意小正数),其中m为n次试验中事件A出现的次数。伯努利定理刻画了大量经验观测中呈现的稳定性,作为大数定律的最早形式而在概率论发展史上占有重要地位。
伯努利之后,棣莫弗(A.De Moivre,1667-1754)、蒲丰(G.-L.L.Buffon,1707-1788)、拉普拉斯、高斯和泊松等对概率论作出了进一步的奠基性贡献。其中,棣莫弗(1733)和高斯(1809)各自独立引进了正态分布;蒲丰提出了投针问题和几何概率(1777);
[
棣莫弗-拉普拉斯定理:设随机变量Y_n(n=1,2,…)服从参数为n,p的二项分布,则对于任意x,有lim[n->∞]P{(Y_n-np)/sqrt(np(1-p))<=x}=∫[-∞,x](1/sqrt(2pi))e^(-t^2/2)dt=Φ(x)。
定理表明二项分布的极限分布是正态分布。一般来说,当n较大时,二项分布的概率计算起来非常复杂,这时我们就可以用正态分布来近似地计算二项分布。
几何概率的定义
将事件A与样本空间S用几何量的测度S_A与S(长度、面积或体积)之比,即概率P=S_A/S,称为几何概率。
几何概率的基本性质
从几何概型的概率研究中,我们发现概率有下面三个基本性质:概率的非负性,概率的规范性,概率的可列可加性。前两个性质与古典概率相同,后一个性质则要求对可列个两两互不相容的事件成立。
定义:设随机试验E的样本空间是S={e},若对于每一个e∈S,有一个实数X(e)与之对应,即X(e)是定义在S上的单值实函数,称为随机变量(简记为r.v.)。
定义:若随机变量全部可能取到的值是有限多个或可列无限多个,则称为离散型随机变量。
定义:设试验E只有两个可能的结果A与~A,且P(A)=p(0<p<1),将试验E独立重复地进行n次,这样的试验称为贝努利试验。
设X是n重贝努利试验中事件A发生的次数,则X是一个随机变量,于是
P(X=k)=(n上,k下)p^k(1-p)^(n-k),k=0,1,2,…,n。称为X服从参数为n,p的二项分布,记为X~b(n,p)。
当n=1时,P(X=k)=p^k(1-p)^(1-k),k=0,1。即为0-1分布。
1806年,泊松推广了大数定律,提出了泊松分布。
1837年,泊松发表“对审判概率的探讨”,给出“泊松分布”。
若X的分布为P(X=k)=λ^ke^(-λ)/k!,k=0,1,2,…,其中λ>0是常数,则称X服从参数为λ的泊松分布。记为X~π(λ)。
几何分布
进行重复独立试验,设每次试验成功的概率为p,失败的概率为1-p=q(0<p<1),将试验进行到出现一次成功为止,以X表示所需的试验次数,则X的分布律为:P{X=k}=q^(k-1)p,k=1,2,…,称为X服从参数为p的几何分布。
]
泊松陈述了泊松大数定律(1837),等等。特别是拉普拉斯1812年出版的《概率的分析理论》,以强有力的分析工具处理概率论的基本内容,使以往零散的结果系统化。拉普拉斯的著作实现了从组合技巧向分析方法的过渡,开辟了概率论发展的新时期。正是在这部著作中,拉普拉斯给出了概率的古典定义:
事件A的概率P(A)等于一次试验中有利于事件A的可能的结果数与该试验中所有可能的结果数之比。
[
等可能概率模型中事件概率的计算公式
等可能概型(古典概型)的两个特点:
(1)样本空间中的元素只有有限个;
(2)每个基本事件发生的可能性相同。
若事件A包含k个基本事件(基本事件是两两不相容的),即A={e_i_1}∪{e_i_2}∪…∪{e_i_k},这里i_1,i_2,…,i_k是1,2,…中某k个不同的数。则有P(A)=∑[j=1->k]P({e_i_k})=k/n=A包含的样本点数/样本点总数。
拉普拉斯在1812年把上式作为概率的一般定义。事实上它只适用于古典概型场合。
求解古典概型问题的关键是弄清基本事件空间的样本点总数和所求概率事件包含的样本点个数。
从古典概型的概率研究中,我们发现概率有下面三个基本性质:概率的非负性,概率的规范性,概率的(有限)可加性。
]
19世纪后期,极限理论的发展成为概率论研究的中心课题,俄国数学家切比雪夫(1821-1894)在这方面作出了重要贡献。他在1866年建立了关于独立随机变量序列的大数定律,使伯努利定律和泊松大数定律成为其特例。切比雪夫还将棣莫弗-拉普拉斯极限定理推广为更一般的中心极限定理。切比雪夫的成果后又被他的学生马尔可夫(1856-1922)等发扬光大,影响了20世纪概率论发展的进程。
[
几何概率中的悖论
几何概率在现代概率概念的发展中曾经起过重大作用,19世纪时,不少人相信,只要找到适当的等可能性描述,就可以给概率问题以唯一的解答,然而有人却构造出这样子的例子,它包含着几乎似乎都同样有理但却互相矛盾的答案,下面就是一个著名的例子。
【贝特朗奇论】在半径为1的圆内随机地取一条弦,问其长超过该圆内接等边三角形的边长sqrt(3)的概率等于多少?
同一问题有三种不同的答案,细究其原因,发现是在取弦时采用不同的等可能性假定。在解法1中,假定弦的中点在直径上均匀分布,在解法2总假定端点在圆周上均匀分布,在解法3中假定弦的中点在圆内均匀分布。由此例看出,等可能性引起了怪现象。
]
19世纪末,概率论在统计物理等领域的应用提出了对概率论基本概念与原理进行解释的需要。另外,科学家们在这一时期发现的一些概率论悖论也揭示出古典概率论中基本概率论中基本概念存在的矛盾与含糊之处,其中最著名的是所谓的“贝特朗悖论”,1899年由法国学者贝特朗(J.Bertrand)提出:
在半径为r的圆内随机选择弦,计算弦长超过圆内接正三角形边长的概率。根据“随机选择”的不同意义,可以得到不同的答案。
(1)考虑与某确定方向平行的弦,则所求概率为1/2。 ----YES
(2)考虑从圆上某固定点P引出的弦,则所求概率为1/3。----YES
(3)随机的意义理解为:弦的中点落在圆的某个部分的概率与该部分的面积成正比,则所求概率为1/4。----YES
这类悖论说明概率的概念是以某种确定的实验为前提的,这种实验有时由问题本身所明确规定,有时则不然。因此,贝特朗等悖论的矛头直指概率概念本身,特别地,拉普拉斯的古典概率定义开始受到猛烈批评。
这样,到19世纪末,无论是概率论的实际应用还是其自身发展,都强烈地要求对概率论的逻辑基础作出更加严格的考察。 
(二)酝酿与准备
最早对概率论严格化进行尝试的,是俄国数学家伯恩斯坦(1880-1968)和奥地利数学家冯·米西斯(R.von Mises,1883-1953)。他们都提出了一些公理来作为概率论的前提,但他们的公理理论都是不完善的。真正严格的公理化概率论只有在测度论与实变函数理论的基础上才可能建立。事实上,对概率论基本概念的分析越来越揭示出这些概念与测度论及度量函数中基本概念之间的深刻相似性,使数学家们看到了一条建立概率论逻辑基础的正确道路。
这方面的先行者是法国数学家博雷尔。作为测度论的奠基人,博雷尔早在1905年就指出概率论理论如果采用测度论术语表述将会方便许多,并首先将测度论方法引入概率论重要问题的研究。特别是1909年他提出并在特殊情形下解决了随机变量序列ξ_1,ξ_2,…,服从强大数定律的条件问题。科尔莫哥罗夫(1903-1987)在1926年推导了弱大数定律成立的充分必要条件,后又对博雷尔提出的强大数定律问题给出了最一般的结果。在所有这些研究中,与可测函数论的类比起着极重要的作用。大数定律是概率论的中心课题之一,它的解决标志着测度论与可测函数论在概率论研究中的有力渗透,成为以测度论为基础的概率论公理化的前奏。
(三)科尔莫戈罗夫公理化
从1920年代中期起,科尔莫戈罗夫开始从测度论途径探讨整个概率论理论的严格表述, 其结果是1933年以德文出版的经典性著作《概率论基础》。科尔莫戈罗夫是莫斯科函数论学派领导人鲁金(1883-1950)的学生,对实变函数论的运用可以说是炉火纯青。他在这部著作中建立起集合测度与事件概率的类比、积分与数学期望的类比、函数正交性与随机变量独立性的类比……,等等。这种广泛的类比终于赋予了概率论以演绎数学的特征。
科尔莫戈罗夫公理化概率论中的第一个基本概念,是所谓“基本事件集合”。 对于概率论的逻辑展开而言,集合E的元素是抽象的、非具体的,正如公理化几何学中的点、线、面等一样。
E的任意子集,即由可能的结果事件组成的任意集合,被称为随机事件。并不是所有的随机事件都被考虑,而只考虑一定的事件域。我们知道,概率论只处理那些在某种意义上发生频率稳定的事件。在科尔莫戈罗夫的公理化理论中,对于域中的每一个事件,都有一个确定的非负实数与之对应,这个数就叫做该事件的概率。在这里,概率的定义同样是抽象的,并不涉及频率或其他任何有具体背景的概念。
科尔莫戈罗夫提出了6条公理,整个概率论大厦可以从这6条公理出发建筑起来。科尔莫戈罗夫的公理系逐渐获得了数学家们的普遍承认。由于公理化,概率论成为一门严格的演绎科学。
[
在公理化定义中只规定了概率应满足的性质,而不具体规定出它的计算公式或计算方法。
关于概率公理化定义的进一步说明
事实上在概率的公理化定义中,样本点e不再看作是随机试验的结果,而是一些抽象的点,这些点的全体构成样本空间S,一般不把S的一切子集都作为事件,若把事件的全体记为F,它是由S的一些子集构成的集类,且满足以下条件:(1)S∈F;(2)若A∈F,则~A∈F。(3)若A_n∈F,n=1,2,…,则∪[n=1->∞]A_n∈F。一般地,称满足上述三个要求的集类为σ-域。
这里F称为事件域,F中的元素称为事件,S称为必然事件,Φ称为不可能事件。定义在事件域F上的一个集合函数P称为概率,如果它还满足非负性、规范性和可列可加性。在柯尔莫戈洛夫的概率公理化结构中,称(S,F,P)为概率空间。
]
发布了132 篇原创文章 · 获赞 10 · 访问量 20万+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章