数据分析(一)--准备

需要准备的学科

  1. 概率论
  2. 统计学
  3. 线性代数
  4. 高等数学

一、统计学

1.众数

是数据的一种代表数,反映了一组数据的集中程度。

往往反映了一种最普通的倾向。

例:2,3,-1,2,1,3

众数:2,3

例:1,2,3,4,5

众数:无

注意

  1. 众数可以不唯一,但也可以没有
  2. 众数在高斯分布中,位于峰值

众数也可以用于非数值类的数列当中

例:鸡,鸭,鱼,鸡

众数:鸡

2.中位数

就是中值,按顺序排列的一组数据中,居于中间位置的数。
在这里插入图片描述

特点

不受极值影响,部分数据的变动对中位数没有影响。

常用它描述这组数据的集中趋势。

注意

中位数只能有一个。
在这里插入图片描述

例:numbers = [23,29,20,32,23,21,33,25]

排序:[20,21,23,23,25,29,32,33] n=8

中位数:(23+25)/2=24

3.平均数

是计算得来的,每一个数据的变化都会影响它的变化,不稳定,极值对它影响较大。

4.方差

衡量随机变量或一组数据离散程度的度量。

方法

每个样本值,与全体样本值的平均数之差,的平方值,的平均值。
在这里插入图片描述

例:2,2,3,4,4

全体样本值的平均数:(2+2+3+4+4)/5 = 3

每个样本值与全体样本值的平均数之差的平方的平均值:((2-3)2+(2-3)2+(3-3)2+(4-3)2+(4-3)^2)/5 =0.8

例:1,-1,0,-1,1

方差:0.8

例:1,20,2,9,90

在这里插入图片描述

方差:1121.84

结论

方差越小,表示数据的波动越小;方差越大,表示数据的波动越大。

5.标准差(均方差)

就是方差的算数平方根。

一个较大的标准差,代表大部分数值与其平均值之间的差异较大;一个较小的标准差,代表着大部分数值与其平均值之间的差异较小,即这些数接近平均值(波动较小)。

6.高斯(Gaussian)分布

别名–正态分布
在这里插入图片描述

特点

数据分布呈现‘钟型’曲线。

  1. 中间高,两头低
  2. 左右对称

区分–拉普拉斯分布

在这里插入图片描述

二、高等数学、线性代数

(一)矩阵

在这里插入图片描述

1.矩阵的表示

在这里插入图片描述

2.特殊矩阵

(1)零矩阵

在这里插入图片描述

(2)行矩阵(n维列向量),m=1

在这里插入图片描述

(3)列矩阵(m为行向量),n=1

在这里插入图片描述

(4)n阶矩阵,即m=n

(5)对角矩阵

在这里插入图片描述

(6)单位矩阵

在这里插入图片描述

(7)n阶数量矩阵

在这里插入图片描述

(8)上三角矩阵

在这里插入图片描述

(9)下三角矩阵

在这里插入图片描述

3.如何判断矩阵相等

A,B两个矩阵对应位置上的元素相等,则A=B。
在这里插入图片描述

4.矩阵线性运算

(1)矩阵的加法

A +B 等于矩阵A和B的对应位置相加,放到对应位置上。
在这里插入图片描述

运算定律

  1. A+B=B+A
  2. (A+B)+C=A+(B+C)
  3. A+0=A

(2)负矩阵

A的负矩阵,就是A的所有元素求负值。

(3)矩阵减法

A-B=A+(-B)

A+(-A)=0

(4)数与矩阵的乘法(数乘法)

kA,k是一个常数。

A的所有元素,乘以k。
在这里插入图片描述
在这里插入图片描述
运算定律

  1. k(A+B)=kA+kB
  2. (k+l)A=kA+lA
  3. klA=k(lA)
  4. 1A=A,-1A=-A,A-A=0

在这里插入图片描述

(5)矩阵乘法

不是所有矩阵都能做乘法。

要求:第一个矩阵的列数和第二个矩阵的行数相同。

结果的行数是A的行数,结果的列数是B的列数。

矩阵乘法和数乘法的区别

  1. 矩阵乘法不满足交换律,AB不等于BA
  2. 两个非零矩阵的乘积可以是零矩阵
  3. 有AB=AC,B和C不一定相等

运算定律

  1. ABC=A(BC)
  2. (A+B)C=AC+BC
  3. C(A+B)=CA+CB
  4. k(AB)=(kA)B=A(kB)
    在这里插入图片描述
    在这里插入图片描述

5.矩阵的应用–数据统计

在这里插入图片描述

6.矩阵的转置

在这里插入图片描述
在这里插入图片描述

运算定律
在这里插入图片描述

(二)分块矩阵

由于有时计算矩阵相乘的矩阵比较大,计算起来比较麻烦,就产生了分块矩阵。
在这里插入图片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章