機器學習與網絡安全（四）概率學基礎

計算機科學所處理的內容大部分是完全確定且必然的，程序員寫程序時是假定CPU將完美執行每條指令，硬件錯誤是非常罕見並在編程階段幾乎不予考慮。

深度學習通常是處理一些不確定的隨機的量，像我們初始化的時候，經常會把權值初始化爲隨機值，有的實驗中是這樣做的。

但機器學習中幾乎處處都會使用概率，例如：

評估一種疾病的爆發率
預測貨幣交易在某一時間點的市值
理解一句話中每個詞語間的關聯含義（自然語言像智能翻譯）
判斷一個交通標誌是否是限速（自動駕駛）
判斷一封郵件是否爲垃圾郵件（樸素貝葉斯）
針對同類的病人研究其相近的DNA端的序列段
生成與現實中相近的包與鞋子的搭配
幾乎所有的活動都需要在不確定性存在時進行推理，除了那些被定義爲真的數學聲明，我們很難認定某個命題是千真萬確的或者確保某一件是一定會發生。

不確定性有三種可能來源：

1、被建模系統內在它存在一種隨機性，比如紙牌遊戲，開局時我們都是假設紙牌被洗爲隨機序列；

2、不完全觀測，例如砸金蛋的遊戲，設置金蛋的人可以知道哪個金蛋裏有大獎，但砸金蛋人的角度大獎的概率是不確定的；

3、不完全建模，例如三個杯子裏一個硬幣的遊戲，將一個硬幣放在中間的杯子中，然後隨意轉換杯子的相互位置，如果不允許觀察轉換過程，則無法良好預測硬幣最後在哪邊的杯子中。

比如說簡單的原則，多數鳥都會飛，這個描述就很簡單，而正式的規則是除了那些非常小的還沒有學會飛翔的幼鳥，以及因爲生病或者受傷失去了飛翔能力的鳥，還有不會飛的鳥類包括石花鳥鴕鳥等等，所以還是多數鳥兒都會飛這樣的定義會比較好用。

概率論最初的發展是爲了分析事件發生的頻率，所以說我們很容易可以看出概率論,就像是在打撲克的時候抽出一手特定的牌這種事件的研究中是如何使用的，這類事件往往是可以重複的，我們用概率只是表示一種信任度。

基本概念
1、確定性現象，也可以稱爲確定性事件，一定條件下必然發生的事情，比如說你用手來開一個開門，那麼門就開了，這就是一個確定性事件。

2、隨機性現象，在一定條件下可能出現不同的結果。試驗前不可預知，大量重複實驗具有統計規律性。

隨機實驗

1.一些隨機事件

一枚硬幣，觀察正反面的出現情況，拋一次再拋三次，觀察正反面的出現情況；一枚硬幣拋三次觀察正面出現的次數；拋一枚色子，觀察出現的點數，它都是可以反覆進行的。

2.樣本空間與隨機事件