文章目录

一、简介

一、简介

1.1 内生变量与外生变量

内生变量

内生变量是具有某种概率分布的随机变量，它的参数是联立方程系统估计的元素，是由模型系统决定的，同时也对模型系统产生影响。
内生变量–般都是明确经济意义变量。
一般情况下，内生变量与随机项相关，即 $Cov\left( Y_i,\varepsilon _i \right) \ne 0$
在联立方程模型中，内生变量既作为被解释变量，又可以在不同的方程中作为解释变量。

外生变量

外生变量一般是确定性变量，或者是具有临界概率分布的随机变量，其参数不是模型系统研究的元素。
外生变量影响系统，但本身不受系统的影响。
外生变量一般是经济变量、政策变量、虚拟变量。
一般情况下，外生变量与随机项不相关。

注意：一个变量是内生变量还是外生变量，由经济理论和经济意义决定，不是从数学形式决定。

1.2 VAR模型概念

向量自回归模型，简称VAR模型，是AR 模型的推广，是一种常用的计量经济模型。在一定的条件下，多元MA和ARMA模型也可转化成VAR模型。

VAR模型是用模型中所有当期变量对所有变量的若干滞后变量进行回归。

即

向量自回归模型把系统中每-一个内生变量作为系统中所有内生变量的滞后值的函数来构造模型，从而实现了将单变量自回归模型推广到由多元时间序列变量组成的“向量”自回归模型。

VAR模型常用于预测相互联系的时间序列系统以及分析随机扰动对变量系统的动态影响，主要应用于宏观经济学。是处理多个相关经济指标的分析与预测中最容易操作的模型之一。

由于向量自回归模型把每个内生变量作为系统中所有内生变量滞后值的函数来构造模型，从而避开了结构建模方法中需要对系统每个内生变量关于所有内生变量滞后值的建模问题。

1.3 VAR模型结构

单变量的时间序列的分析模式可以推广到多变量时间序列，建立向量自回归模型。向量自回归模型通常用于描述多变量时间序列之间的变动关系，不需要经济理论作为基础，从数据出发建立模型，是一种非结构化的模型。

非限制性向量自回归模型的一般表达式如下：

模型的基本形式是弱平稳过程的自回归表达式，描述的是在同一样本期间内的若干变量可以作为它们过去值的线性函数。

$Y_t=\varPhi _0+\varPhi _1Y_{t-1}+\cdots +\varPhi _pY_{t-p}+BX_t+\varepsilon _t\ \text{，\ }t=1,2,\cdots ,T$

其中
$Y_t=\left( \begin{array}{c} y_{1t}\\ y_{2t}\\ \vdots\\ y_{kt}\\ \end{array} \right) \text{，}\varepsilon _t=\left( \begin{array}{c} \varepsilon _{1t}\\ \varepsilon _{2t}\\ \vdots\\ \varepsilon _{kt}\\ \end{array} \right) \text{，}\varPhi _0=\left( \begin{array}{c} \phi _{10}\\ \phi _{20}\\ \vdots\\ \phi _{k0}\\ \end{array} \right)$

$\varPhi _i=\left( \begin{matrix} \phi _{11}\left( i \right)& \phi _{12}\left( i \right)& \cdots& \phi _{1k}\left( i \right)\\ \phi _{21}\left( i \right)& \phi _{22}\left( i \right)& \cdots& \phi _{2k}\left( i \right)\\ \vdots& \vdots& \ddots& \vdots\\ \phi _{k1}\left( i \right)& \phi _{k2}\left( i \right)& \cdots& \phi _{kk}\left( i \right)\\ \end{matrix} \right) \,\,\text{，\,\,}i=1,2,\cdots ,p$

$Y_t$ 表示 k 维内生变量列向量
$Y_{t-i}\text{，}i=1,2,\cdots ,p$ 为滞后的内生变量
$X_t$ 表示 d 维外生变量列向量，它可以是常数变量、线性趋势项或者其他非随机变量
p 是滞后阶数
T 为样本数目
$\varPhi _i$ 即 $\varPhi _1,\varPhi _2\cdots ,\varPhi _p$ 为 $k\times k$ 维的待估矩阵
B 为 $k\times d$ 维的待估矩阵
$\varepsilon _t\sim N\left( 0,\varSigma \right)$ 为 k 维白噪声向量，它们相互之间可以同期相关，但不与自己的滞后项相关（诸 $\varepsilon _t$ 独立同分布，而 $\varepsilon _t$ 中的分量不要求相互独立），也不与上式中右边的变量相关。 $\varSigma$ 是 $\varepsilon _t$ 的协方差矩阵，是一个 $k\times k$ 的正定矩阵。.

比如 1 维 p 阶向量自回归模型

$\left\{ \begin{array}{l} y_{1t}=\phi _{10}+\phi _{11}\left( 1 \right) y_{1,t-1}+\phi _{12}\left( 1 \right) y_{2,t-1}+\cdots +\phi _{1n}\left( 1 \right) y_{n,t-1}\\ \ \ \ \ \ \ \ \ +\phi _{11}\left( 2 \right) y_{1,t-2}+\phi _{12}\left( 2 \right) y_{2,t-2}+\cdots +\phi _{1n}\left( 2 \right) y_{n,t-2}\\ \ \ \ \ \ \ \ \ +\cdots\\ \ \ \ \ \ \ \ \ +\phi _{11}\left( p \right) y_{1,t-p}+\phi _{12}\left( p \right) y_{2,t-p}+\cdots +\phi _{1n}\left( p \right) y_{n,t-p}+\varepsilon _t\\ \end{array} \right.$

不含常数项或线性趋势项的向量自回归模型表达式为：

$Y_t=\varPhi _1Y_{t-1}+\cdots +\varPhi _pY_{t-p}+\varepsilon _t\ \text{，\ }t=1,2,\cdots ,T$

1.4 VAR模型的特点

不以严格的经济理论为依据。在建模过程中只需明确两件事：①共有哪些变量是相互有关系的，把有关系的变量包括在VAR模型中；②确定滞后期 p。使模型能反映出变量间相互影响的绝大部分。
VAR模型对参数不施加零约束。（对无显着性的参数估计值并不从模型中剔除，不分析回归参数的经济意义。）
VAR模型的解释变量中不包括任何当期变量，所有与联立方程模型有关的问题在VAR模型中都不存在（主要是参数估计量的非一致性问题）。
VAR模型的另一个特点是有相当多的参数需要估计。比如一个VAR模型含有三个变量，最大滞后期 p=3，则有27个参数需要估计。当样本容量较小时，多数参数的估计量误差较大。
无约束VAR模型的应用之一是预测。由于在VAR模型中每个方程的右侧都不含有当期变量，这种模型用于样本外一期预测的优点是不必对解释变量在预测期内的取值做任何预测。
用VAR模型做样本外近期预测非常准确。做样本外长期预测时，则只能预测出变动的趋势，而对短期波动预测不理想。

二、模型的定阶（滞后阶数检验）

滞后阶数检验需要考虑两个问题：

第一，如果滞后阶数 p 比较小，那么随机误差项会出现自相关的问题；
第二，在实际应用中，通常希望滞后阶数 p 足够大，进而能够更好的体现所构造的模型的动态特征，但是如果滞后阶数 p 过大时，那么模型所需要估计的参数就越多，将存在自由度太小的问题，如果没有足够多的样本数量，就会造成所需要估计参数不能有效的计算出来。

所以，在做滞后阶数检验之前，需要把各种因素都考虑在内，这样才能保证检验结果是有效的。

有两种方法可以做滞后阶数检验：

第–种方法，分析各种准则，最后确定滞后阶数，AIC准则、SC准则、HQ准则、LogL准则、最终预测误差（FPE）；.
第二种方法，分析似然比（LR），这种方法不会出现第一-种方法的无效结果。

第一种方法被学者们用的最多。.第一种方法中的五个指标在各个阶数的估计值，选取五个检验准则最小值数量最多的阶数即为模型的滞后期数。

比如

三、模型的系数估计

对于向量自回归模型系统中的每一个方程都可以采用OLS（最小二乘估计）方法进行估计，同时估计量具有一致性和无偏性。

一个 k 维 p 阶向量自回归模型中，各方程中所有解释变量的滞后期是相同的，都为滞后 p 期，因此共估计得到 $p\times k^2+k$ 个系数。

四、单位根检验

时间序列平稳性是指–组数列的统计值与时间无关，不会随时间推移而变化，它通常是以因果关系为基础的数学模型的假设条件。

如果时间序列 $y_t$ 是一组平稳序列，那么经过计算分析得到其均值 $E\left( y_t \right)$ 不随时间变化而变化，其方差 $Var\left( y_t \right)$ 也不受时间的影响。
如果时间序列 $y_t$ 不是一组平稳序列，那么它的均值和方差都会受到时间t影响，随之改变。

在VAR模型中，必须保证时间序列稳定。如果不能保证时间序列稳定，那么会导致两种结果：

第一，向量自回归系数的估计值是负数，做完 t 检验后，得到的结果是无效的；
第二，两个独立变量的相关关系或者回归关系是假的，使得模型的结果无效。

（1）DF 检验

DF 检验只适用于一阶自回归过程的平稳性检验

在一阶自回归序列中，
$y_t=\phi _1y_{t-1}+\varepsilon _t\ ,\ \varepsilon _t\sim N\left( 0,\sigma _{\varepsilon}^2 \right)$
该序列的特征方程为：

$\lambda -\phi _1=0$

特征根为：
$\lambda =\phi _1$
当特征根在单位圆内时： $\left| \phi _1 \right|<1$ ，该序列平稳
当特征根在单位圆上或单位圆外时： $\left| \phi _1 \right|\ge 1$ ，该序列非平稳

所以可以通过检验特征根是在单位圆内还是在单位圆上（外），来检验序列的平稳性，这种检验就称为单位根检验。

由于现实生活中绝大多数序列都是非平稳序列，所以单位根检验的原假设定为：

$H_0:\text{序列\ }y_t\ \text{非平稳}\Leftrightarrow H_0:\left| \phi _1 \right|\ge 1$

相应的备择假设为： $H_1:\text{序列\ }y_t\ \text{平稳}\Leftrightarrow H_1:\left| \phi _1 \right|<1$
检验统计量为： $t\left( \phi _1 \right) =\frac{\hat{\phi}_1-\phi _1}{S\left( \hat{\phi}_1 \right)}$
拒绝原假设，认为序列 $y_t$ 显著平稳

（2）ADF 检验

因为 DF 检验只适用于1阶自回归过程的平稳性检验，但实际上绝大多数时间序列都不会是一个简单的AR(1)过程。为了使DF检验能适用于AR( p )过程的平稳性检验，对其进行了一定的修正，得到增广DF检验（augmented Dickey-Fuller)，简记为ADF检验。

对任一 AR ( p ) 过程

$y_t=\phi _1y_{t-1}+\cdots +\phi _py_{t-p}+\varepsilon _t$

特征方程：
$\lambda ^p-\phi _1\lambda ^{p-1}-\phi _2\lambda ^{p-2}-\cdots -\phi _p=0$

如果该方程所有的特征根都在单位圆内，即 $\left| \lambda _i \right|<1\text{，}i=1,2,\cdots ,p$

则序列 $y_t$ 平稳

如果有一个单位根存在，不妨设
$\lambda _1=1$

则序列 $y_t$ 非平稳，且自回归系数之和恰好等于1：
$\left\{ \begin{array}{l} \lambda ^p-\phi _1\lambda ^{p-1}-\cdots -\phi _p\lambda ^{p-p}=0\\ \\ \xRightarrow{\lambda =1}\\ \\ 1-\phi _1-\cdots -\phi _p=0\\ \\ \Rightarrow\\ \\ \phi _1+\phi _2+\cdots +\phi _p=1\\ \end{array} \right.$

因而，对于AR( p )过程，可以通过检验自回归系数之和是否等于1来考察该序列的平稳性.

将.上述推广到 VAR( p ) 模型中，如果特征方程
$\left| I_N\lambda ^p-\varPhi _1\lambda ^p-\varPhi _2\lambda ^p-\cdots -\varPhi _p \right|=0$

的所有特征根都落在单位圆内，即 $\left| \lambda _i \right|<1\text{，}\left( i=1,2,\cdots ,p \right)$ ，那么就说 VAR( p ) 模型是协方差稳定的。

引入延迟算子B，如果 VAR( p ) 模型满足
$\left| I_N-\varPhi _1B-\varPhi _2B^2-\cdots -\varPhi _pB^p \right|=0$

的所有根都在单位圆外，模型也是协方差稳定的。

对

$y_t=\phi _1y_{t-1}+\cdots +\phi _py_{t-p}+\varepsilon _t$
进行等价变换：
$y_t-y_{t-1}=\phi _1y_{t-1}+\cdots +\phi _py_{t-p}-y_{t-1}+\varepsilon _t$

整理得
$\triangledown y_t=\left( \phi _1+\cdots +\phi _{p-1} \right) y_{t-1}-\left( \phi _2+\cdots +\phi _p \right) \triangledown y_{t-1}-\cdots -\phi _p\triangledown y_{t-p+1}+\varepsilon _t$
简记为
$\triangledown y_t=\alpha y_{t-1}+\beta _1\triangledown y_{t-1}+\cdots +\beta _{p-1}\triangledown y_{t-p+1}+\varepsilon _t$
式中
$\left\{ \begin{array}{l} \alpha =\phi _1+\phi _2+\cdots \phi _p-1\\ \\ \beta _j=-\phi _{j+1}-\phi _{j+2}-\cdots -\phi _p\ \text{，\ }j=1,2,\cdots ,p-1\\ \end{array} \right.$

若序列 $y_t$ 平稳，则 $\phi _1+\phi _2+\cdots \phi _p<1$ 等价于 α<0

若序列 $y_t$ 非平稳，则至少存在一个单位根，有
$\phi _1+\phi _2+\cdots \phi _p=1$
等价于 α=0

则AR( p )过程单位根检验的假设条件可以确定为：
$H_0:\alpha =0\left( \text{序列非平稳} \right) \longleftrightarrow H_1:\alpha <0\left( \text{序列平稳} \right)$

构造ADF检验统计量：

$\tau =\frac{\hat{\alpha}}{S\left( \hat{\alpha} \right)}$

$S\left( \hat{\alpha} \right)$ 为参数 α 的样本标准差

通过蒙特卡洛方法，可以得到r检验统计量的临界值表，显然DF检验是ADF检验在自相关阶数为1时的一个特例，所以统称为ADF检验

利用 EVIEWS 可以进行平稳性检验

五、格兰杰因果检验

在有些情况下，时间序列分析也会出现伪相关问题，也就是可以计算出较大的相关系数的变量实际上并不相关。

针对此问题，格兰杰因果检验由此而生。格兰杰因果检验用于检验时间序列之间是否存在相关关系，它是能否建立脉冲函数的前提。

在VAR模型中，格兰杰检验的因果关系不是通常所说的因果关系（并非真正汉语意义上的“因果关系”），而是说先发生的事情对后发生的事情有–定的影响，或者说某个变量是否可以用来提高对其他相关变量的预测能力。所以，“格兰杰因果关系的实质是一-种“预测”关系

其实质是考量一个变量的滞后量能否加入到其他变量的公式中。当一个变量确实受到其他变量的滞后量影响时，可以称这两个变量具有格兰杰因果关系。

格兰杰因果检采取以下方式验证是否是真正的相关关系：

（1）估计当前的Y值被Y本身滞后期取值所能解释的程度；
（2）检验加入X的滞后期后，Y的被解释程度是否提高；
（3）如果满足条件（2），则X是Y的格兰杰成因，此时X的滞后期系数具有统计显著性。

具体是通过在向量自回归模型系统中考察序列滞后项的系数是否全为零来进行检验。以一个2维p阶平稳向量自回归模型为例

$\left\{ \begin{array}{l} y_{1t}=\phi _{10}+\phi _{11}\left( 1 \right) y_{1,t-1}+\phi _{11}\left( 2 \right) y_{1,t-2}+\cdots +\phi _{11}\left( p \right) y_{1,t-p}\\ \ \ \ \ \ \ \ \ +\phi _{12}\left( 1 \right) y_{2,t-1}+\phi _{12}\left( 2 \right) y_{2,t-2}+\cdots +\phi _{12}\left( p \right) y_{2,t-p}+\varepsilon _t\\ \end{array} \right.$
$\left\{ \begin{array}{l} y_{2t}=\phi _{20}+\phi _{21}\left( 1 \right) y_{1,t-1}+\phi _{21}\left( 2 \right) y_{1,t-2}+\cdots +\phi _{21}\left( p \right) y_{1,t-p}\\ \ \ \ \ \ \ \ \ +\phi _{22}\left( 1 \right) y_{2,t-1}+\phi _{22}\left( 2 \right) y_{2,t-2}+\cdots +\phi _{22}\left( p \right) y_{2,t-p}+\varepsilon _t\\ \end{array} \right.$

可以写成
$\left| \begin{array}{l} \left[ \begin{array}{c} y_{1t}\\ y_{2t}\\ \end{array} \right] =\left[ \begin{array}{c} \phi _{10}\\ \phi _{20}\\ \end{array} \right] +\left[ \begin{matrix} \phi _{11}\left( 1 \right)& \phi _{12}\left( 1 \right)\\ \phi _{21}\left( 1 \right)& \phi _{22}\left( 1 \right)\\ \end{matrix} \right] \left[ \begin{array}{c} y_{1,t-1}\\ y_{2,t-1}\\ \end{array} \right] +\left[ \begin{matrix} \phi _{11}\left( 2 \right)& \phi _{12}\left( 2 \right)\\ \phi _{21}\left( 2 \right)& \phi _{22}\left( 2 \right)\\ \end{matrix} \right] \left[ \begin{array}{c} y_{1,t-2}\\ y_{2,t-2}\\ \end{array} \right]\\ \\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ +\cdots +\left[ \begin{matrix} \phi _{11}\left( p \right)& \phi _{12}\left( p \right)\\ \phi _{21}\left( p \right)& \phi _{22}\left( p \right)\\ \end{matrix} \right] \left[ \begin{array}{c} y_{1,t-p}\\ y_{2,t-p}\\ \end{array} \right] +\left[ \begin{array}{c} \varepsilon _{1t}\\ \varepsilon _{2t}\\ \end{array} \right]\\ \end{array} \right.$

检验原假设： $H_0:\ y_{2t}\text{不是}y_{1t}\text{的格兰杰原因}$

则通过F检验来检验联合假设
$\phi _{12}\left( 1 \right) =\phi _{12}\left( 2 \right) =\cdots =\phi _{12}\left( p \right) =0$

若检验结果拒绝原假设，即拒绝 $y_{2t}$ 不是 $y_{1t}$ 的格兰杰原因，则通常称 $y_{2t}$ 是 $y_{1t}$ 的格兰杰原因。

由于格兰杰因果关系检验是在向量自回归模型的基础上进行的，因此向量自回归模型本身的合理性对格兰杰因果关系检验的结果也是非常重要的。例如，向量自回归模型本身应当具有恰当的滞后期。

六、脉冲响应分析

在VAR模型中，脉冲响应分析的作用是可以分析某个变量对另一个变量的影响时间和幅度。研究当扰动项发生变化时，对整个模型系统产生的影响，用来描述一个变量的变动怎样影响模型其他所有的变量。

如果时间序列是稳定的，虽然前几期受到外部冲击的影响，该变量会处于一个变化的状态，但经过一段时间，最终会处于-一个平稳的状态。

由于向量自回归模型表达式中所需要估计的参数非常多，并且一个系数只能反应局部关系。

也就是，VAR模型中的各个等式中的系数并不是研究者最终关注的对象，对模型表达式中的系数的研究意义并不大。但是如果考虑一个扰动项变动，或者受到一个干扰或冲击，各个变量之间的动态关系，也就是系统的动态反应，是具有–定意义的。

脉冲响应函数

在参数估计量的评价标准中，一般包含无偏性、有效性、相合性和一致性，而VAR模型参数的普通最小二乘法估计量只具有–致性，因此要解释复杂的经济问题，单个参数估计值是很难完成的。

一个有效的对VAR模型进行分析的方法就是脉冲响应函数。

脉冲响应函数研究的是随机干扰项遭受冲击后内生变量的反应，用来描述对随机干扰项施加一一个冲击后对内生变量的当期值和未来值造成的影响。

在实际的应用中，由于VAR模型是一种非理论性的模型，因此在对VAR模型的分析中，很少研究一个变量的变化对另-一个变量的影响，而是专注于当一个随机误差项变化时（对随机误差项施加冲击），对系统的动态影响。

七、方差分解

在VAR模型中，得到了某个变量对另一个变量的解释度后，能够分析出该变量的重要性。变量会产生一些随机误差项，这些随机误差项都包含着重要的信息，方差分解的结果能够把这些信息全部说明出来。方差分解的作用非常大，这个过程的作用是能够分析某个变量对另-一个变量的解释度。

如果说脉冲响应函数是来描述数学模型中的任一内生变量的正交冲击对其他变量造成的影响，那么方差分解就是分析各个内生变量的正交冲击对目标内生变量冲击的贡献比例，进而判断分析各个变量的重要性。

参考：

《浅析中国对美贸易额的影响因素》_张康琦
《基于VAR模型的GDP和CPI对居民生活水平的影响分析》_陈小龙
《向量自回归模型扰动分布的光滑检验及其应用》_钟嫕姝

VAR（向量自回归）模型

文章目录

一、简介

1.1 内生变量与外生变量

1.2 VAR模型概念

1.3 VAR模型结构

1.4 VAR模型的特点

二、模型的定阶（滞后阶数检验）

三、模型的系数估计

四、单位根检验

五、格兰杰因果检验

六、脉冲响应分析

七、方差分解

VAR（向量自迴歸）模型

邏輯迴歸（分類算法）

sklearn中的降維算法

灰色關聯模型

[線性模型總結] 線性迴歸+方差分析+協方差分析+混合效應+面板數據模型

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結