人工智能基本概念的思考——概率分佈函數

一、概率論中概率分佈函數的定義

1.隨機試驗

      (1)可以在相同的條件下重複地進行;

      (2)每次試驗的可能結果不止一個,並且能事先明確試驗的所有可能結果

      (3)進行一次試驗之前不能確定哪一個結果會出現.

2.樣本空間

    對於隨機試驗,儘管在每次試驗之前不能預知試驗的結果,但試驗的所有可能結果組成的集合是已知的.

  (1) 樣本空間:隨機試驗 E 的所有可能結果組成的集合稱爲 E 的樣本空間,記爲 S.

    (3)樣本點: 樣本空間的元素.即E的每個結果,稱爲樣本點.

3.隨機事件

      在實際中,當進行隨機試驗時,人們常常關心滿足某種條件的那些樣本點所組成的集合.

      隨機事件 : 我們稱試驗 E 的樣本空間 S 的子集爲 E 的隨機事件,簡稱事件.

4.隨機變量

5.分佈函數

6.總結

我們對每一個 在相同條件下,會呈現不同結構的隨機事件賦予一個數值。其後我們研究這個數值的性質。我們將這些性質擴充爲一門學科——概率論。


現在我們思考一個簡單的分類任務。我們看看在這個任務中,什麼是隨機變量,如何量化隨機變量。


二、圖像識別——熊貓和狗

1.圖像採集之隨機變量

場景一:一隻小熊貓在樹上玩耍。

我們要採集熊貓的圖片,訓練出可識別熊貓的模型。在環境不變的情況下,即小熊貓玩耍的場景不變,拍攝的人不變,相機不變等等。我們拍攝出來的圖片可能不一樣。根據概率論的定義,拍攝熊貓圖片爲一隨機事件。設圖一爲隨機事件A。

現在我們要定義一個實值函數f(A),將隨機事件A變成數字。圖一是一個分辨率爲920X517的圖片。定義一個920X517的X矩陣和A對應,即

這裏我們建立了一個隨機事件A(熊貓圖像)到矩陣X的映射。隨機事件A對應920X517個隨機變量,即

 是一個隨機變量。

2.計算概率

隨機事件A發生的概率如何計算?根據大數定律我們知道,當實驗次數足夠多時,隨機事件A發生的概率近似等於頻率。所以我們在相同的情況下,拍攝足夠多的圖像,統計圖一出現的頻率,即可得到圖一的概率。即,P(圖一) = 圖一出現的頻率。

3.概率分佈函數

根據上面分佈函數的定義,我們知道:

這個分佈函數的意義:給出隨機變量a小於x的概率。它衡量的是一系列圖像出現的概率。

4.邊緣分佈

    我們給定的應用背景是識別熊貓和狗。所以當我們拍攝一張熊貓的圖片時,會給定該圖片熊貓的標籤。所以我們在定義隨機變量

的時候,應該再加一維,把標註信息y加上,即隨機變量爲 

此時,概率分佈函數爲

則邊緣分佈函數爲

邊緣分佈函數的意義就是第三節公式一的含義。

5.條件分佈

我們訓練一個模型最終的意義是識別熊貓和狗。圖片爲熊貓時,令y=0。圖片爲狗時,令y=1.

給定一張圖片B,如上圖所示,我們要求出該圖片屬於狗的概率是多少。即,P(y|B)=?

這裏圖片B是已知的,標籤y是未知的。我們要在B已知的情況下,計算y的概率,稱爲條件分佈。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章