需要准备的学科
- 概率论
- 统计学
- 线性代数
- 高等数学
一、统计学
1.众数
是数据的一种代表数,反映了一组数据的集中程度。
往往反映了一种最普通的倾向。
例:2,3,-1,2,1,3
众数:2,3
例:1,2,3,4,5
众数:无
注意
- 众数可以不唯一,但也可以没有
- 众数在高斯分布中,位于峰值
众数也可以用于非数值类的数列当中
例:鸡,鸭,鱼,鸡
众数:鸡
2.中位数
就是中值,按顺序排列的一组数据中,居于中间位置的数。
特点
不受极值影响,部分数据的变动对中位数没有影响。
常用它描述这组数据的集中趋势。
注意
中位数只能有一个。
例:numbers = [23,29,20,32,23,21,33,25]
排序:[20,21,23,23,25,29,32,33] n=8
中位数:(23+25)/2=24
3.平均数
是计算得来的,每一个数据的变化都会影响它的变化,不稳定,极值对它影响较大。
4.方差
衡量随机变量或一组数据离散程度的度量。
方法
每个样本值,与全体样本值的平均数之差,的平方值,的平均值。
例:2,2,3,4,4
全体样本值的平均数:(2+2+3+4+4)/5 = 3
每个样本值与全体样本值的平均数之差的平方的平均值:((2-3)2+(2-3)2+(3-3)2+(4-3)2+(4-3)^2)/5 =0.8
例:1,-1,0,-1,1
方差:0.8
例:1,20,2,9,90
方差:1121.84
结论
方差越小,表示数据的波动越小;方差越大,表示数据的波动越大。
5.标准差(均方差)
就是方差的算数平方根。
一个较大的标准差,代表大部分数值与其平均值之间的差异较大;一个较小的标准差,代表着大部分数值与其平均值之间的差异较小,即这些数接近平均值(波动较小)。
6.高斯(Gaussian)分布
别名–正态分布
特点
数据分布呈现‘钟型’曲线。
- 中间高,两头低
- 左右对称
区分–拉普拉斯分布
二、高等数学、线性代数
(一)矩阵
1.矩阵的表示
2.特殊矩阵
(1)零矩阵
(2)行矩阵(n维列向量),m=1
(3)列矩阵(m为行向量),n=1
(4)n阶矩阵,即m=n
(5)对角矩阵
(6)单位矩阵
(7)n阶数量矩阵
(8)上三角矩阵
(9)下三角矩阵
3.如何判断矩阵相等
A,B两个矩阵对应位置上的元素相等,则A=B。
4.矩阵线性运算
(1)矩阵的加法
A +B 等于矩阵A和B的对应位置相加,放到对应位置上。
运算定律:
- A+B=B+A
- (A+B)+C=A+(B+C)
- A+0=A
(2)负矩阵
A的负矩阵,就是A的所有元素求负值。
(3)矩阵减法
A-B=A+(-B)
A+(-A)=0
(4)数与矩阵的乘法(数乘法)
kA,k是一个常数。
A的所有元素,乘以k。
运算定律:
- k(A+B)=kA+kB
- (k+l)A=kA+lA
- klA=k(lA)
- 1A=A,-1A=-A,A-A=0
(5)矩阵乘法
不是所有矩阵都能做乘法。
要求:第一个矩阵的列数和第二个矩阵的行数相同。
结果的行数是A的行数,结果的列数是B的列数。
矩阵乘法和数乘法的区别
- 矩阵乘法不满足交换律,AB不等于BA
- 两个非零矩阵的乘积可以是零矩阵
- 有AB=AC,B和C不一定相等
运算定律:
- ABC=A(BC)
- (A+B)C=AC+BC
- C(A+B)=CA+CB
- k(AB)=(kA)B=A(kB)
5.矩阵的应用–数据统计
6.矩阵的转置
运算定律:
(二)分块矩阵
由于有时计算矩阵相乘的矩阵比较大,计算起来比较麻烦,就产生了分块矩阵。