機器學習與網絡安全(四)概率學基礎

計算機科學所處理的內容大部分是完全確定且必然的,程序員寫程序時是假定CPU將完美執行每條指令,硬件錯誤是非常罕見並在編程階段幾乎不予考慮。

深度學習通常是處理一些不確定的隨機的量,像我們初始化的時候,經常會把權值初始化爲隨機值,有的實驗中是這樣做的。

但機器學習中幾乎處處都會使用概率,例如:

評估一種疾病的爆發率
預測貨幣交易在某一時間點的市值
理解一句話中每個詞語間的關聯含義(自然語言像智能翻譯)
判斷一個交通標誌是否是限速(自動駕駛)
判斷一封郵件是否爲垃圾郵件(樸素貝葉斯)
針對同類的病人研究其相近的DNA端的序列段
生成與現實中相近的包與鞋子的搭配
幾乎所有的活動都需要在不確定性存在時進行推理,除了那些被定義爲真的數學聲明,我們很難認定某個命題是千真萬確的或者確保某一件是一定會發生。

不確定性有三種可能來源:

1、被建模系統內在它存在一種隨機性,比如紙牌遊戲,開局時我們都是假設紙牌被洗爲隨機序列;

2、不完全觀測,例如砸金蛋的遊戲,設置金蛋的人可以知道哪個金蛋裏有大獎,但砸金蛋人的角度大獎的概率是不確定的;

3、不完全建模,例如三個杯子裏一個硬幣的遊戲,將一個硬幣放在中間的杯子中,然後隨意轉換杯子的相互位置,如果不允許觀察轉換過程,則無法良好預測硬幣最後在哪邊的杯子中。

比如說簡單的原則,多數鳥都會飛,這個描述就很簡單,而正式的規則是除了那些非常小的還沒有學會飛翔的幼鳥,以及因爲生病或者受傷失去了飛翔能力的鳥,還有不會飛的鳥類包括石花鳥鴕鳥等等,所以還是多數鳥兒都會飛這樣的定義會比較好用。

概率論最初的發展是爲了分析事件發生的頻率,所以說我們很容易可以看出概率論,就像是在打撲克的時候抽出一手特定的牌這種事件的研究中是如何使用的,這類事件往往是可以重複的,我們用概率只是表示一種信任度。

基本概念
1、確定性現象,也可以稱爲確定性事件,一定條件下必然發生的事情,比如說你用手來開一個開門,那麼門就開了,這就是一個確定性事件。

2、隨機性現象,在一定條件下可能出現不同的結果。試驗前不可預知,大量重複實驗具有統計規律性。

隨機實驗

1.一些隨機事件

一枚硬幣,觀察正反面的出現情況,拋一次再拋三次,觀察正反面的出現情況;一枚硬幣拋三次觀察正面出現的次數;拋一枚色子,觀察出現的點數,它都是可以反覆進行的。

2.樣本空間與隨機事件

在這裏插入圖片描述

事件與關係運算

事件A它的概率比事件B小,然後它是屬於B的,也就是說當A如果發生了,我們可以認爲B就發生了,但是當B發生了,我們不能認爲就是說A發生了。

在這裏插入圖片描述
在這裏插入圖片描述

事件運算定律

交換律。大家看一下這些,基本上以前都學過交換律,結合律分配律,德摩根律。那麼這裏就有一個作業,就是找一個合適的實驗實驗來確定一下樣本空間,在這個實驗裏找三個事件abc,然後進行上面的運算,自己嘗試一下。
在這裏插入圖片描述

獨立性 ​

事件A與B獨立的條件,AB同時發生的概率和A單獨發生以及B單獨發生的概率是一樣的。

指數分佈

在這裏插入圖片描述

拉普拉斯分佈

允許在任意一點μ處設置概率質量的峯值

拉普拉斯平滑算法這個概念最初是用來判斷太陽第二天還能不能升起來。跟貝葉斯有點像,太陽能升起來的概率平常是100%,如果明天有意外世界毀滅、發生核戰爭,這種也是事件都要添加進去,第一個事件是太陽正常升起,第二個事件是其他,小概率事件也要不斷的去推算。

經驗分佈

經驗分佈是將概率密度1/m賦給m個點中的每一個,這些點是給定的數據集合或採樣的集合。

分佈的混合
在這裏插入圖片描述

常用函數有用性質

1、logistics sigmoid 函數

在這裏插入圖片描述
在這裏插入圖片描述

2、softplus函數
在這裏插入圖片描述
在這裏插入圖片描述
內容來自安全牛課堂《機器學習與網絡安全》

課程地址:https://www.aqniukt.com/course/4868

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章