单变量随机扩散过程的参数估计——Hermite序列近似估计转移密度

随机扩散过程参数估计——Hermite序列近似估计转移密度

这篇博文基于作者个人最近阅读Yacine(2002)年的一篇很经典的论文的理解。这篇文章比较牛逼之处在于可以通过Hermite序列近似估计出转移概率密度(regardless the underlying distribution),从而得到一个外生得似然函数。并且可以扩展到多维的随机过程。

(未完待续 …)

虽然Yacine公开了程序,但是作者最近求知欲爆棚(比较无聊),所以记下自己的理解和自己猜测的一些推导细节。当然,刚开始学习,理解还浮于表面,如果有不到位的地方,希望路过的大牛能够指出。

对于一个一般的扩散过程:
dXt=μ(Xt;θ)dt+σ(Xt;θ)dWt(1) d \boldsymbol{X}_{t}=\mu\left(\boldsymbol{X}_{t} ; \boldsymbol{\theta}\right) d t+\sigma\left(\boldsymbol{X}_{t} ; \boldsymbol{\theta}\right) d \boldsymbol{W}_{t}\tag{1}
比如说CIR过程:
dxt=α(μxt)dt+σxtdWt(1*) d x_{t}=\alpha\left(\mu-x_{t}\right) d t+\sigma \sqrt{x_{t}} d W_{t}\tag{1*}
从作者的上一篇博文可知,CIR过程服从非中心卡方分布,转移概率计算相当复杂。但是通过一系列的变换,Yacine让以上的过程更加近似于正态分布,从而可以用Hermite序列来近似估计正态分布函数。这个变换就是一个从X到Z的过程。得到Z过程的近似转移概率后,我们可以倒推到X过程,从而推出外生的似然函数,最终目标如下:
n(θ)i=1nln{pX(Δ,XiΔX(i1)Δ;θ)}(**) \ell_{n}(\theta) \equiv \sum_{i=1}^{n} \ln \left\{p_{X}\left(\Delta, X_{i \Delta} | X_{(i-1) \Delta} ; \theta\right)\right\}\tag{**}
通过似然函数的最优化,即可以对未知参数进行估计。具体的变化过程如下:

第一步, 标准化,去除方差的影响。 (XY)(X\rightarrow Y)
Yγ(X;θ)=xdu/σ(u;θ)(2) Y \equiv \gamma(X ; \theta)=\int^{x} d u / \sigma(u ; \theta)\tag{2}
带入Ito公式
dYs=μY(Yt;θ)dt+dWt, where μY(y;θ)=μ(γ1(y;θ);θ)σ(γ1(y;θ);θ)12σx(γ1(y;θ);θ) \begin{aligned} &d Y_{s}=\mu_{Y}\left(Y_{t} ; \theta\right) d t+d W_{t}, \quad \text { where }\\ &\mu_{Y}(y ; \theta)=\frac{\mu\left(\gamma^{-1}(y ; \theta) ; \theta\right)}{\sigma\left(\gamma^{-1}(y ; \theta) ; \theta\right)}-\frac{1}{2} \frac{\partial \sigma}{\partial x}\left(\gamma^{-1}(y ; \theta) ; \theta\right) \end{aligned}
第二步, 中心化,去除尖峰影响。(YZ)(Y\rightarrow Z)
ZΔ1/2(Yy0)(3) Z \equiv \Delta^{-1 / 2}\left(Y-y_{0}\right)\tag{3}
第三步,利用Hermite序列近似逼近Z的转移概率密度:
pZ(J)(Δ,zy0;θ)ϕ(z)j=0JηZ(j)(Δ,y0;θ)Hj(z)(4) p_{Z}^{(J)}\left(\Delta, z | y_{0} ; \theta\right) \equiv \phi(z) \sum_{j=0}^{J} \eta_{Z}^{(j)}\left(\Delta, y_{0} ; \theta\right) H_{j}(z)\tag{4}
其中ϕ(z)ez2/2/2π\phi(z) \equiv e^{-z^{2} / 2} / \sqrt{2 \pi}, 是标准的正态分布密度函数。而
Hj(z)ez2/2djdzj[ez2/2],j0(5) H_{j}(z) \equiv e^{z^{2} / 2} \frac{d^{j}}{d z^{j}}\left[e^{-z^{2} / 2}\right], \quad j \geq 0\tag{5}
是标准的Hermite序列。系数项可以如下的积分过程得到
ηZ(j)(Δ,y0;θ)(1/j!)+Hj(z)pZ(Δ,zy0;θ)dz(6) \eta_{Z}^{(j)}\left(\Delta, y_{0} ; \theta\right) \equiv(1 / j !) \int_{-\infty}^{+\infty} H_{j}(z) p_{Z}\left(\Delta, z | y_{0} ; \theta\right) d z\tag{6}
这里我想可以近似于傅里叶逼近来理解,毕竟Hermite序列也是正交序列。所以证明方法应该和傅里叶序列函数逼近差不多,因而我目前还不是特别好奇。

第四步,已知Z的状态转移密度,求Y的状态转移密度:(ZY)(Z\rightarrow Y)

根据(3)和(4):
pY(J)(Δ,yy0;θ)Δ1/2pZ(J)(Δ,Δ1/2(yy0)y0;θ)(7) p_{Y}^{(J)}\left(\Delta, y | y_{0} ; \theta\right) \equiv \Delta^{-1 / 2} p_{Z}^{(J)}\left(\Delta, \Delta^{-1 / 2}\left(y-y_{0}\right) | y_{0} ; \theta\right)\tag{7}
第五步,已知Y的转移密度,得到X的转移密度:(ZY)(Z\rightarrow Y)
pX(J)(Δ,xx0;θ)σ(x;θ)1pY(J)(Δ,γ(x,θ)γ(x0;θ);θ)(8) p_{X}^{(J)}\left(\Delta, x | x_{0} ; \theta\right) \equiv \sigma(x ; \theta)^{-1} p_{Y}^{(J)}\left(\Delta, \gamma(x, \theta) | \gamma\left(x_{0} ; \theta\right) ; \theta\right)\tag{8}
第六步,最大化似然函数(**)。

以上即为Yacine似然估计的整个流程,而这里最重要也最复杂的就是第三步,如何通过序列逼近pZ(J)(Δ,zy0;θ)p_{Z}^{(J)}\left(\Delta, z | y_{0} ; \theta\right)

通过较为简单的变量替换,我们有如下的结果
ηZ(j)(Δ,y0;θ)=(1/j!)+Hj(z)pZ(Δ,zy0;θ)dz=(1/j!)+Hj(z)Δ1/2pY(Δ,Δ1/2z+y0y0;θ)dz=(1/j!)+Hj(Δ1/2(yy0))pY(Δ,yy0;θ)dy=(1/j!)E[Hj(Δ1/2(Yt+Δy0))Yt=y0;θ] \begin{aligned} \eta_{Z}^{(j)}\left(\Delta, y_{0} ; \theta\right) &=(1 / j !) \int_{-\infty}^{+\infty} H_{j}(z) p_{Z}\left(\Delta, z | y_{0} ; \theta\right) d z \\ &=(1 / j !) \int_{-\infty}^{+\infty} H_{j}(z) \Delta^{1 / 2} p_{Y}\left(\Delta, \Delta^{1 / 2} z+y_{0} | y_{0} ; \theta\right) d z \\ &=(1 / j !) \int_{-\infty}^{+\infty} H_{j}\left(\Delta^{-1 / 2}\left(y-y_{0}\right)\right) p_{Y}\left(\Delta, y | y_{0} ; \theta\right) d y \\ &=(1 / j !) E\left[H_{j}\left(\Delta^{-1 / 2}\left(Y_{t+\Delta}-y_{0}\right)\right) | Y_{t}=y_{0} ; \theta\right] \end{aligned}
这里,第二行的推导参照(7),可以反解出:
pZ(Δ,zy0;θ)=Δ1/2pY(Δ,Δ1/2z+y0y0;θ)(9) p_{Z}\left(\Delta, z | y_{0} ; \theta\right)=\Delta^{1 / 2} p_{Y}\left(\Delta, \Delta^{1 / 2} z+y_{0} | y_{0} ; \theta\right)\tag{9}
第三行带入(3)即可。最后一行是期望的定义。然后最后一行的期望项用Tarlor公式展开:
E[f(Yt+Δ,y0)Yt=y0]=k=0KAk(θ)f(y0,y0)Δkk!+E[AK+1(θ)f(Yt+δ,y0)Yt=y0]ΔK+1(K+1)!(10) E\left[f\left(Y_{t+\Delta}, y_{0}\right) | Y_{t}=y_{0}\right]= \sum_{k=0}^{K} A^{k}(\theta) \cdot f\left(y_{0}, y_{0}\right) \frac{\Delta^{k}}{k !} \\ +E\left[A^{K+1}(\theta) \cdot f\left(Y_{t+\delta}, y_{0}\right) | Y_{t}=y_{0}\right] \frac{\Delta^{K+1}}{(K+1) !}\tag{10}
这里 f(y,y0)=Hj(Δ1/2(Yt+Δy0))f\left(y, y_{0}\right)=H_{j}\left(\Delta^{-1 / 2}\left(Y_{t+\Delta}-y_{0}\right)\right). 通过定义 (5),我们展开前七项的Hermite序列

H0(z)H_0(z) 1
H1(z)H_1(z) -x
H2(z)H_2(z) x21x^2-1
H3(z)H_3(z) x3+3x-x^3+3x
H4(z)H_4(z) x46x2+3x^4-6x^2+3
H5(z)H_5(z) x5+10x315x-x^5+10x^3-15x
H6(z)H_6(z) x615x4+45x215x^6-15x^4+45x^2-15

而算子A=μyy+122y2A = \mu_y\frac{\partial}{\partial y} +\frac{1}{2}\frac{\partial^2}{\partial y^2}。这里ηZ(k,j)(Δ,y0;θ)\eta_{Z}^{(k,j)}\left(\Delta, y_{0} ; \theta\right)有两个上标, k表示泰勒展开的阶数,j代表Hermite序列的阶数。Yacine在文章中给出了前七项的表达式,如图

]
还有第一项ηZ(0,3)=1\eta^{(0,3)}_Z=1;
ηZ(1,3)=μYΔ1/2(2μYμY[1]+μY[2])Δ3/2/4(4μYμY[1]2+4μY2μY[2]+6μY[1]μY[2]+4μYμY[3]+μY[4])Δ5/2/24(a) \eta_{Z}^{(1,3)}=-\mu_{Y} \Delta^{1 / 2}-\left(2 \mu_{Y} \mu_{Y}^{[1]}+\mu_{Y}^{[2]}\right) \Delta^{3 / 2} / 4 \\ -\left(4 \mu_{Y} \mu_{Y}^{[1] 2}+4 \mu_{Y}^{2} \mu_{Y}^{[2]}+6 \mu_{Y}^{[1]} \mu_{Y}^{[2]}+4 \mu_{Y} \mu_{Y}^{[3]}+\mu_{Y}^{[4]}\right) \Delta^{5 / 2} / 24\tag{a}
这里给出第二项的证明,其他项亦然:

泰勒展开(10), K=3K=3
A0f(y0,y0)+A1f(y0,y0)Δ+A2f(y0,y0)Δ22!+A3f(y0,y0)Δ33!+E[A3f(yt+δ,y0)]Δ44!(a.1) A^{0}f(y_0,y_0)+A^1f(y_{0},y_{0})\Delta + A^{2}f\left( y_0,y_0 \right) \frac{\Delta^{2}} {2!} + A^{3}f\left( y_0,y_0 \right) \frac{\Delta^{3}}{3!} + E[A^{3}f\left( y_{t+\delta},y_0 \right)]\frac{\Delta^{4}}{4!}\tag{a.1}
每一项计算如下:
A0f(y,y0)=H(Δ12(yy0))y=y0=Δ12(yy0)y=y0=0 A^{0}f\left( y,y_0\right) =H\left(\Delta ^{-\frac {1} {2}}\left( y-y_{0}\right) \right)|_{y=y_0}=\Delta ^{-\frac {1}{2}}\left( y-y_{0}\right)|_{y=y_0}= 0

A1f(y,y0)=μΔ12 A^{1}f\left( y,y_0\right) = \mu\Delta ^{-\frac {1} {2}}

A2f(y,y0)=A(μΔ12)=(μy(μ)+122y2(μ))Δ12=(μμ(1)+μ(2))Δ12 A^2f\left( y,y_0\right) = A(\mu\Delta^{-\frac{1}{2}})=\left(\mu\frac{\partial}{\partial y}(\mu) +\frac{1}{2}\frac{\partial^2}{\partial y^2}(\mu)\right)\Delta^{-\frac{1}{2}} = (\mu\mu^{(1)}+\mu^{(2)})\Delta^{-\frac{1}{2}}

A3f(y,y0)=A((μμ(1)+μ(2))Δ12)=(μy(μμ(1)+μ(2))+122y2(μμ(1)+μ(2)))Δ12=12Δ12(4μYμY[1]2+4μY2μY[2]+6μY[1]μY[2]+4μYμY[3]+μY[4]) A^3f\left( y,y_0\right) = A((\mu\mu^{(1)}+\mu^{(2)})\Delta^{-\frac{1}{2}}) = \left(\mu\frac{\partial}{\partial y}(\mu\mu^{(1)}+\mu^{(2)}) +\frac{1}{2}\frac{\partial^2}{\partial y^2}(\mu\mu^{(1)}+\mu^{(2)})\right)\Delta^{-\frac{1}{2}} \\=\frac{1}{2}\Delta^{-\frac{1}{2}}\left(4 \mu_{Y} \mu_{Y}^{[1] 2}+4 \mu_{Y}^{2} \mu_{Y}^{[2]}+6 \mu_{Y}^{[1]} \mu_{Y}^{[2]}+4 \mu_{Y} \mu_{Y}^{[3]}+\mu_{Y}^{[4]}\right)

带入以上的泰勒展开(a.1)即可得(a).

下面就来到了我头疼了两天的部分,(3)和(4)代入(7),我们会得到
pY(J)(Δ,yy0;θ)Δ1/2ϕ(Δ1/2(yy0))j=0JηZ(j)(Δ,y0;θ)Hj(Δ1/2(yy0))(11) p_{Y}^{(J)}\left(\Delta, y | y_{0} ; \theta\right) \equiv \Delta^{-1 / 2} \phi(\Delta^{-1 / 2}\left(y-y_{0}\right)) \sum_{j=0}^{J} \eta_{Z}^{(j)}\left(\Delta, y_{0} ; \theta\right) H_{j}(\Delta^{-1 / 2}\left(y-y_{0}\right))\tag{11}
ηZ(k,j)(Δ,y0;θ)\eta_{Z}^{(k,j)}\left(\Delta, y_{0} ; \theta\right)HjH_j代入到(11),并且取出Δk\Delta ^{k}的所有系数项。便可推导出这篇文章最最最重要的一个结论:
p~Y(K)(Δ,yy0;θ)=Δ1/2ϕ(yy0Δ1/2)exp(y0yμY(w;θ)dw)k=0Kck(yy0;θ)Δkk!(12*) \tilde{p}_{Y}^{(K)}\left(\Delta, y | y_{0} ; \theta\right)=\Delta^{-1 / 2} \phi\left(\frac{y-y_{0}}{\Delta^{1 / 2}}\right) \exp \left(\int_{y_{0}}^{y} \mu_{Y}(w ; \theta) d w\right) \sum_{k=0}^{K} c_{k}\left(y | y_{0} ; \theta\right) \frac{\Delta^{k}}{k !}\tag{12*}
其中c0(yy0;θ)=0c_{0}\left(y | y_{0} ; \theta\right)=0. 其他的项可以通过迭代算出
cj(yy0;θ)=j(yy0)jy0y(wy0)j1×{λY(w;θ)cj1(wy0;θ)+(2cj1(wy0;θ)/w2)/2}dw(12.1*) c_{j}\left(y | y_{0} ; \theta\right)= j\left(y-y_{0}\right)^{-j} \int_{y_{0}}^{y}\left(w-y_{0}\right)^{j-1} \\ \times\left\{\lambda_{Y}(w ; \theta) c_{j-1}\left(w | y_{0} ; \theta\right)+\left(\partial^{2} c_{j-1}\left(w | y_{0} ; \theta\right) / \partial w^{2}\right) / 2\right\} d w\tag{12.1*}
其实,我深知直接用(12*)和(12.1*)就可以解决我大部分的问题,但是小编个人天生爱研究(找虐),居然脑补了两天这个是怎么凑出来的,也算是小有所获,但是今天比较晚了(妈妈叫我去喝牛奶),就先写到这里,明天晚上再继续补充这部分的笔记。
实,我深知直接用(12*)和(12.1*)就可以解决我大部分的问题,但是小编个人天生爱研究(找虐),居然脑补了两天这个是怎么凑出来的,也算是小有所获,但是今天比较晚了(妈妈叫我去喝牛奶),就先写到这里,明天晚上再继续补充这部分的笔记。
参考文献:
Maximum-Likelihood Estimation of Discretely-Sampled Diffusions: A Closed-Form Approximation Approach, Econometrica,2002, 70, 223-262 (this paper received the 1998 Cornerstone Research
Award)
链接:https://www.princeton.edu/~yacine/mle.pdf

结束语:本系列的文章是Yacine大神论文研究的读后感,不得不表达一下自己的崇拜之情,Yacine开源了自己所有的文章和程序,让大家使用和学习。超前的研究,超前的思想,虽然大神的境界不可企及,但是可以膜拜。哈哈,最重要的一点对自己说,从明天开始务正业,务正业!!!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章