统计学第十六周时间序列分析与预测

概念：

基本概念

时间序列：是同一现象在不同时间的相继观察值排列而成的序列。

平稳序列：基本上不存在趋势的序列。各观察值基本上在某个固定的水平上波动，虽然在不同的时间段波动的程度不同，单并不存在某种规律，波动可以看成是随机的。

非平稳序列：包含趋势、季节性或周期性的序列，它可能只包含其中一种成分，也可能包含几种成分，非平稳序列又分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

趋势：是时间序列在长期内呈现出来的某种持续上升或持续下降的波动，也称为长期趋势。时间序列可是是线性的，也可以是非线性的。

季节性也成季节变动，它是时间序列在一年内重复出现的周期性波动。

周期性：时间序列呈现出来的围绕长期趋势的一种波浪形或震荡式变动。

随机性：时间序列中除去趋势、周期性和季节性之后的偶然性波动。

时间序列的成分：趋势T 、季节性或季节变动S、周期性或循环波动C、随机性或不规则波动I ，分解以乘法模型。

时间序列的描述：增长率、平均增长率、

时间序列的预测：

（1）确定时间序列所包含的成分，也就是确定时间序列的类型（绘图或拟合）

（2）找出适合此类时间序列的预测方法

（3）对可能的预测方法进行评估，已确定最佳预测方案（平均误差、平均绝对误差、均方误差、平均百分比误差和平均绝对百分比误差、）

（4）利用最佳预测方案进行预测
平稳序列的预测

平稳时间序列通常只包含随机成分，其预测方法主要简单平均法、移动平均法和指数平滑法等。

简单平均法：就是t+1期把已有的t期观测值求和取平均，t+2期是把前面t+1前观测值求和取平均值，依次类推。缺点是对近期与远期数据的响应不及时

移动平均法：采用最近k期数据进行求平均值，第t期的数据预测值计算是，t-1,t-2,…,t-k+1期数据观测值求均值，第t+1期则是t,t-1,…-t-k+2 缺点是k不容易确定

指数平滑法：通过对过去的观察值加权平均进行预测的一种方法。即第t+1期的数值预测是通过第t期的实际值与第t期的预测值之间加权和，观察值的时间越远，其所占权重就越下降，具体表现程指数下降。
$F_{t+1} = \alpha Y_t+(1-\alpha )F_t$

$F_{2} = \alpha Y_{1}+(1-\alpha F_{1})=\alpha Y_{1}+(1-\alpha)Y_1=Y_1$

$F_3=\alpha Y_2 +(1-\alpha )F_2=\alpha Y_2+(1-\alpha)Y_1$

$F_4= \alpha Y_3+(1-\alpha )F_3=\alpha Y_3+(1-\alpha)\alpha Y_2+(1-\alpha)^2 Y_1$

$因此指数平滑法，任何预测值F_{t+1}都是以前所有的实际观察值的加权平均，F_{t+1}=\alpha Y_t+(1-\alpha) F_t=F_t+\alpha (Y_t-F_t)$

指数平滑法关键是确定平滑系数a，其比较接近1时，观察值占比越重；当其越接近0时，预测值所占的比重就比较大。

从简单平均法、移动平均法、指数平滑化比较而言，这三种算法的趋势是向影响因素较大的方向倾斜，同时对近期结果所占的作用进行强调，倾向于对a优化，其实际是对观测值带系数的整式系数的确认，简单平均法是各份子系数为1，移动平均法是中间一段为1，其他为0，指数平滑法系数是一个指数函数形式。因此系数方程的构造可以认为是一种研究的方向。
趋势型序列的预测

趋势型序列的预测分为线性趋势预测、非线性趋势预测和自回归模型预测等。

线性趋势linear trend ，是指现象随着时间的推移而呈现出稳定增长或下降的线性变化规律。

非线性回归趋势预测，常用的趋势曲线有指数曲线和多阶曲线

指数曲线：

二次曲线：

此外还有修正指数曲线、Gompertz曲线、Logistic曲线等。

复合型序列的分解预测

复合型序列：是指含有含有趋势性、季节性和周期性的序列。

对这类序列进行分析的传统方法就是将时间序列的各个因素依次分解出来，并分别进行分析。一般分解顺序是先求季节因素，再求出趋势因素，最后求出周期性因素和随机因素。
这类预测主要有季节性多元回归模型、季节自回归模型和时间序列分解法预测等

其中时间序列分解法预测：

（1）确定并分离季节成分。计算季节指数，以确定时间序列中的季节成分。然后将季节成分从时间序列中分离出去，即用每一个时间序列观察值除以相应的季节指数，以消除季节性。

（2）建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型并根据这一模型进行预测。

（3）计算最后的预测值。用预测值乘以相应的季节指数，得到最终的预测值。

计算季节指数的方法：移动平均趋势剔除法

第一步：计算移动平均值，并对其结果进行中心化处理，也就是将移动平均的结果再进行一次二项移动平均，得出中心化移动平均值CMA.

第二步，计算移动平均的比值，也称为季节比率，即将序列的各观察值除以相应的中心化移动均值，然后计算出各比值的季度或月份平均值。

第三步，季节指数调整，由于各季节指数的平均数应等于1或100%,若根据第二步计算的季节比率的平均值不等于1，则需要调整。具体调整办法是：将第二步计算的每个季节比率的平均值除以他们的总平均值。

接下来就是每个季节除以对应季节指数，消除季节性：

注：这里上面的数据计算错误了，需要参考下面计算。
2010前两个季度和2015后两个季度不变，其他分别为当季度观测值/季度指数=消除季节性后的数据

之后对消除了季节成分的时间序列建立适当的预测模型并根据这一模型进行预测。

最终的结果是预测消除季节成分的预测值在乘以季节指数，就得到对应的预测结果。

参考：https://blog.csdn.net/hpdlzu80100/article/details/78961452 计算中心化移动平均法（k个临窗的滚动，接下来k个临窗）

注：假设2000年有四个季度某商品其销售量为25、32、37、26。2001年分别为30、38、42、30。则其中心化移动平均值（CMA）＝前四个季度的平均值（25＋32＋37＋26）／4加上接下来的四个季度的平均值（32＋37＋26＋30）／4最后再将以上求出的值求平均值即可，其余季度的中心化平均值求法与之一致。对于求四季度开始的一年的前两个季度是没有CMA的，最后一年的后两个季度也是没有CMA的。

CMA=[(25+32+37+26)/4+(32+37+26+30)/4]/2=30.625 （F4）

CMA=[(32+37+26+30)/4+(37+26+30+38)/4]/2= （F5）

Y/CMA =E4/F4 = G4

季节指数=每个季节的Y/CMA的平均值除以（所有季节的Y/CMA的平均值）

统计学第十六周时间序列分析与预测