本文將結合打升級來大概總結一下信息論中熵的含義,及其與系統隨機性,混亂程度和可預測性的一些關係。後續可能會修改本文添加更多內容。關於熵的內容介紹主要來自於Wikipedia。
熵(Entropy)
信息論中的熵是接收的每條消息中包含的信息的平均量,或者也可以換句話說,熵是信息內容不可預測性的一種度量。仔細想想其實這兩種說法是等價的,但這樣說可能比較抽象,我們考慮一個形象的例子。在大選之前,我們往往會進行一些民意調查(poll),原因在於民調的結果對於我們是未知的,於是民調帶給了我們一些新的信息。如果我們在第一民調之後隨即馬上又進行第二次民調,那麼第二次民調給我們帶來的信息就不如第一次那麼多。也就是說,第二次民調的熵小於第一次民調的熵。
然後我們考慮一個更數學一點的例子,擲硬幣。我們首先考慮一個兩面都是正面的硬幣,那麼它擲出正面的概率就是1,那麼這個事件就沒有隨機性,熵爲0,每一次結果都可以準確預測。然後我們假設一枚均勻的硬幣,那麼擲出正反面的概率都是一樣的,都是0.5。那麼我們可以認爲每擲一次硬幣傳遞的信息都是1個單位,想象一下穿梭在互聯網中的1和0的數據流。這裏我們先引入信息量的計算公式:
於是我們,我們計算可得,
好,接下來結合打升級談一下。四個人打升級兩幅牌共108張,莊家扣底可以多換8張牌,其他人沒人拿25張牌。我們先計算一下起手的時候莊家和閒家拿到幾張 A 的概率。比如莊家拿到
拿幾張A | n=0 | n=1 | n=2 | n=3 | n=4 | n=5 | n=6 | n=7 | n=8 |
---|---|---|---|---|---|---|---|---|---|
概率 | p=0.048 | p=0.186 | p=0.302 | p=0.268 | p=0.141 | p=0.046 | p=0.009 | p=9e-4 | p=4e-5 |
閒家拿到幾張 A 的概率分佈爲
拿幾張A | n=0 | n=1 | n=2 | n=3 | n=4 | n=5 | n=6 | n=7 | n=8 |
---|---|---|---|---|---|---|---|---|---|
概率 | p=0.112 | p=0.295 | p=0.322 | p=0.190 | p=0.066 | p=0.014 | p=0.002 | p=1e-4 | p=3e-6 |
如果我們認爲莊家有A就會在第一輪出A,那麼莊家打出A所帶來的信息量爲:
單獨看這個數值感覺沒什麼意義,我們可以換個角度對比一下。如果我們用一副牌而不是兩幅牌來打升級,莊家和閒家拿到幾個 A 的概率則分別爲:
拿幾張A | n=0 | n=1 | n=2 | n=3 | n=4 |
---|---|---|---|---|---|
概率 | p=0.186 | p=0.406 | p=0.305 | p=0.093 | p=0.010 |
拿幾張A | n=0 | n=1 | n=2 | n=3 | n=4 |
---|---|---|---|---|---|
概率 | p=0.354 | p=0.436 | p=0.180 | p=0.029 | p=0.002 |
類似的,我們可以計算出莊家首輪出 A 和不出 A 的信息量分別爲:
注:其實根據熵,我們還可以衡量某個事件能被準確預測的程度。通過Fano’s inequality可以給出預測準確度的上界。無奈我對Fano’s inequality的理解還不過透徹,暫時沒法寫出來,以後更理解了可能會再補充道這裏。
再注:關於熵的話題的興趣來自於今天看的一篇Science上的文章,Limits of Predictability in Human Mobility。關於打升級話題的興趣來自於最近在放假。