概率論複習

1.頻率與概率

頻率：一個事件的頻數/總試驗次數即爲該事件的頻率，其具有隨機性
概率：是一個確定的值。滿足非負性、規範性（即必然事件的概率爲1）、可列可加性（即互不相容事件的概率等於各個事件概率和）

2.古典概型與幾何概型

1、古典概型的基本事件都是有限的,概率爲事件所包含的基本事件除以總基本事件個數。 2、幾何概型的基本事件通常不可計數,只能通過一定的測度,像長度,面積,體積的的比值來表示。

3.全概率公式與貝葉斯公式

它們實質上是加法公式和乘法公式的綜合運用。其中全概率公式是知原因求結果，並將原因分爲n個分別求結果並相加。貝葉斯公式是知結果求原因，通過條件概率公式以及全概率公式推導而來。

4.獨立事件

需要明確的是獨立與互斥完全是不同的概念，兩者毫無關係。

滿足P（AB）=P(A)P(B)的事件即爲獨立事件。所以必然事件、不可能事件與任何事件都獨立。

5.泊松分佈、二項分佈、0-1分佈

6.分佈函數以及常見的隨機變量分佈

常見的隨機變量分佈：均勻分佈、指數分佈（永遠年輕）、高斯分佈
分佈函數與概率密度函數的關係：

已知X的概率密度函數和Y與X的關係，會求解Y的概率密度函數：求解步驟爲：
先求Y的分佈函數，將Y=g(X)代入，轉換爲X的分佈函數。對左右求導即可得到。

拓展：二維分佈函數

7.邊緣分佈

二維正態分佈的兩個邊緣分佈都是一維正態分佈,但是邊緣分佈均爲正態分佈的隨機變量,其聯合分佈不一定是二維正態分佈。

8.條件分佈

但是對於二維連續型隨機變量來說，不能用以上來定義，因爲此時分母爲零。其分佈函數定義爲（聯合概率密度/邊緣概率密度）再積分，因此其概率密度爲（聯合概率密度/邊緣概率密度）

9.隨機變量的相互獨立性

隨機變量的相互獨立性若用分佈函數表示,即：

對上式求導
1.若變量爲連續型，則表現爲聯合概率密度爲邊緣概率密度的乘積
2.若變量爲離散型，則表現爲聯合事件的概率等於兩個單事件概率的乘積

10.隨機變量函數的分佈

已知x和y的分佈，需要會求以下分佈

方法：

11.期望、方差、協方差

期望、方差的性質和概念：https://www.cnblogs.com/jfdwd/p/11274056.html

協方差：描述的是兩個變量的相關度。爲消除兩個變量的度量的影響，將協方差除以根號下（x的方差*y的方差）作爲相關係數。當X、Y獨立時，協方差爲0，相關係數也爲0，反之不成立，只有X、Y爲二維正態分佈函數兩者纔等價。

12.大數定理、中心極限定理

大數定理是描述相當多次數重複實驗的結果的定律。根據這個定律，樣本數量越多，則其平均就越趨近期望值。
中心極限定理：大量相互獨立隨機變量的均值經適當標準化後依分佈收斂於正態分佈。

-----------------------------------------以下爲數理統計部分------------------------------------------------

1.抽樣的三大分佈

分別爲卡方分佈、t分佈、F分佈

2.重要的幾個抽樣定理

當總體爲正態分佈時，給出幾個重要的抽樣分佈定理.

3.參數估計以及區間估計

一、參數估計問題是利用從總體抽樣得到的信息來估計總體的某些參數或者參數的某些函數.
評價一個估計量的好壞:無偏性、有效性、相合性。
1.無偏性：我們希望估計值在未知參數真值附近擺動，而它的期望值等於未知參數的真值.
2.有效性：一個參數往往有不止一個無偏估計,所以無偏估計以方差小者爲好, 這就引進了有效性這一概念 .
3.相合性：隨着n的無限增大，一個好的估計量與被估參數的真值之間任意接近的可能性會越來越大，這就是所謂的相合性或一致性。

尋求估計量的方法：矩估計法（理論依據爲大數定理）、最大似然估計法
矩估計法：用相應的樣本矩去估計總體矩的估計方法就稱爲矩估計法.其優點是簡單易行,並不需要事先知道總體是什麼分佈 .缺點是，當總體類型已知時，沒有充分利用分佈提供的信息 .
最大似然估計法：最大似然法明確地使用概率模型，其目標是尋找能夠以較高概率產生觀察數據的估計值

二、區間估計：點估計值僅僅是未知參數的一個近似值，它沒有反映出這個近似值的誤差範圍，使用起來把握不大. 區間估計正好彌補了點估計的這個缺陷 .

求解置信區間的步驟：第一步：明確問題, 是求什麼參數的置信區間?置信水平1-α是多少？第二步：尋找待估計參數θ的一個良好的點估計T (X1,X2,…Xn) 第三步：尋找一個待估參數θ和估計量T的函數 S(T,θ ),且其分佈爲已知. 稱S(T, θ )爲樞軸量. 第四步：對於給定的置信水平1-α，根據S(T,θ )的分佈，確定上下限。最後做等價變形即可。

假設檢驗（顯著性檢驗）

根據樣本的信息檢驗關於總體的某個假設是否正確.
誤差分爲：系統誤差和抽樣誤差。差異可能是由抽樣的隨機性引起的，稱爲抽樣誤差；然而，這種隨機性的波動是有一定限度的，如果差異超過了這個限度，必須認爲這個差異反映了事物的本質差別，即爲系統誤差。

那麼如何判斷它究竟是由於偶然性在起作用，還是生產確實不正常？
提出一個假設H0，如果H0 是對的，那麼衡量差異大小的某個統計量落入區域 W(拒絕域) 是個小概率事件. 如果該統計量的實測值落入W，也就是說， H0 成立下的小概率事件發生了，那麼就認爲H0不可信而否定它. 否則我們就不能否定H0 （只好接受）。不否定H0並不是肯定H0一定對，而只是說差異還不夠顯著，還沒有達到足以否定H0的程度 .所以假設檢驗又叫顯著性檢驗。

會出現兩類錯誤：第一是H0爲真，但判定爲假，概率爲α。第二是如果H0不成立，但統計量的實測值未落入否定域，從而沒有作出否定H0的結論，即接受了錯誤的H0，那就犯了“以假爲真”的錯誤 .
兩類錯誤是互相關聯的，當樣本容量固定時，一類錯誤概率的減少導致另一類錯誤概率的增加. 要同時降低兩類錯誤的概率，需要增加樣本容量.

信息與通信工程學科面試——概率論