切比雪夫不等式
- 含義:設隨機變量 的期望爲 ,方差爲 ,對於任意正數 ,有:
- 切比雪夫不等式說明,X的方差越小,事件 的概率就越大。即: 的取值基本上集中在期望 附近。即方差越小,數據的震盪程度越小,數據分佈越集中。
- 切比雪夫不等式的證明
大數定理
- 含義:設隨機變量 互相獨立,並且具有相同的期望 和方差 .作前n個隨機變量的平均 ,則對於任意正數 ,有
- 意義:當n很大時,隨機變量 的平均值 在概率意義下無限接近期望
- 任然有可能出現偏離,但是這種可能性很小,當n無限大時,這種可能性的概率爲0
伯努利大數定理
- 含義:一次試驗中事件 發生的概率爲 ;重複 次獨立實驗中,事件A發生了 次,則 的關係滿足:對於任意正數
- 意義:該定理表明事件A發生的頻率 以概率收斂於事件A的概率p。
- 用途:
- 正態分佈的參數估計
- 樸素貝葉斯做垃圾郵件分類
- 隱馬爾科夫模型有監督參數學習
中心極限定理
- 含義:設隨機變量 互相獨立,服從同一分佈,並且具有相同的期望 和方差 ,則隨機變量的分佈收斂到標準正態分佈
容易得到: 收斂到正態分佈 - 意義:實際問題中,很多隨機現象可以看做許多因素的獨立影響的綜合反應,往往近似服從正態分佈。如:
- 城市耗電量:大量用戶的耗電量總和
- 測量誤差:許多觀察不到的、微小誤差的總和
- 注意,是多個隨機變量的和纔可以,有些問題是乘性誤差,則需要鑑別或者取對數後再使用
- 線性迴歸中,將使用該定理論證最小二乘法的合理性