需要準備的學科
- 概率論
- 統計學
- 線性代數
- 高等數學
一、統計學
1.衆數
是數據的一種代表數,反映了一組數據的集中程度。
往往反映了一種最普通的傾向。
例:2,3,-1,2,1,3
衆數:2,3
例:1,2,3,4,5
衆數:無
注意
- 衆數可以不唯一,但也可以沒有
- 衆數在高斯分佈中,位於峯值
衆數也可以用於非數值類的數列當中
例:雞,鴨,魚,雞
衆數:雞
2.中位數
就是中值,按順序排列的一組數據中,居於中間位置的數。
特點
不受極值影響,部分數據的變動對中位數沒有影響。
常用它描述這組數據的集中趨勢。
注意
中位數只能有一個。
例:numbers = [23,29,20,32,23,21,33,25]
排序:[20,21,23,23,25,29,32,33] n=8
中位數:(23+25)/2=24
3.平均數
是計算得來的,每一個數據的變化都會影響它的變化,不穩定,極值對它影響較大。
4.方差
衡量隨機變量或一組數據離散程度的度量。
方法
每個樣本值,與全體樣本值的平均數之差,的平方值,的平均值。
例:2,2,3,4,4
全體樣本值的平均數:(2+2+3+4+4)/5 = 3
每個樣本值與全體樣本值的平均數之差的平方的平均值:((2-3)2+(2-3)2+(3-3)2+(4-3)2+(4-3)^2)/5 =0.8
例:1,-1,0,-1,1
方差:0.8
例:1,20,2,9,90
方差:1121.84
結論
方差越小,表示數據的波動越小;方差越大,表示數據的波動越大。
5.標準差(均方差)
就是方差的算數平方根。
一個較大的標準差,代表大部分數值與其平均值之間的差異較大;一個較小的標準差,代表着大部分數值與其平均值之間的差異較小,即這些數接近平均值(波動較小)。
6.高斯(Gaussian)分佈
別名–正態分佈
特點
數據分佈呈現‘鍾型’曲線。
- 中間高,兩頭低
- 左右對稱
區分–拉普拉斯分佈
二、高等數學、線性代數
(一)矩陣
1.矩陣的表示
2.特殊矩陣
(1)零矩陣
(2)行矩陣(n維列向量),m=1
(3)列矩陣(m爲行向量),n=1
(4)n階矩陣,即m=n
(5)對角矩陣
(6)單位矩陣
(7)n階數量矩陣
(8)上三角矩陣
(9)下三角矩陣
3.如何判斷矩陣相等
A,B兩個矩陣對應位置上的元素相等,則A=B。
4.矩陣線性運算
(1)矩陣的加法
A +B 等於矩陣A和B的對應位置相加,放到對應位置上。
運算定律:
- A+B=B+A
- (A+B)+C=A+(B+C)
- A+0=A
(2)負矩陣
A的負矩陣,就是A的所有元素求負值。
(3)矩陣減法
A-B=A+(-B)
A+(-A)=0
(4)數與矩陣的乘法(數乘法)
kA,k是一個常數。
A的所有元素,乘以k。
運算定律:
- k(A+B)=kA+kB
- (k+l)A=kA+lA
- klA=k(lA)
- 1A=A,-1A=-A,A-A=0
(5)矩陣乘法
不是所有矩陣都能做乘法。
要求:第一個矩陣的列數和第二個矩陣的行數相同。
結果的行數是A的行數,結果的列數是B的列數。
矩陣乘法和數乘法的區別
- 矩陣乘法不滿足交換律,AB不等於BA
- 兩個非零矩陣的乘積可以是零矩陣
- 有AB=AC,B和C不一定相等
運算定律:
- ABC=A(BC)
- (A+B)C=AC+BC
- C(A+B)=CA+CB
- k(AB)=(kA)B=A(kB)
5.矩陣的應用–數據統計
6.矩陣的轉置
運算定律:
(二)分塊矩陣
由於有時計算矩陣相乘的矩陣比較大,計算起來比較麻煩,就產生了分塊矩陣。