随机扩散过程参数估计——Hermite序列近似估计转移密度
这篇博文基于作者个人最近阅读Yacine(2002)年的一篇很经典的论文的理解。这篇文章比较牛逼之处在于可以通过Hermite序列近似估计出转移概率密度(regardless the underlying distribution),从而得到一个外生得似然函数。并且可以扩展到多维的随机过程。
(未完待续 …)
虽然Yacine公开了程序,但是作者最近求知欲爆棚(比较无聊),所以记下自己的理解和自己猜测的一些推导细节。当然,刚开始学习,理解还浮于表面,如果有不到位的地方,希望路过的大牛能够指出。
对于一个一般的扩散过程:
dXt=μ(Xt;θ)dt+σ(Xt;θ)dWt(1)
比如说CIR过程:
dxt=α(μ−xt)dt+σxtdWt(1*)
从作者的上一篇博文可知,CIR过程服从非中心卡方分布,转移概率计算相当复杂。但是通过一系列的变换,Yacine让以上的过程更加近似于正态分布,从而可以用Hermite序列来近似估计正态分布函数。这个变换就是一个从X到Z的过程。得到Z过程的近似转移概率后,我们可以倒推到X过程,从而推出外生的似然函数,最终目标如下:
ℓn(θ)≡i=1∑nln{pX(Δ,XiΔ∣X(i−1)Δ;θ)}(**)
通过似然函数的最优化,即可以对未知参数进行估计。具体的变化过程如下:
第一步, 标准化,去除方差的影响。 (X→Y)
Y≡γ(X;θ)=∫xdu/σ(u;θ)(2)
带入Ito公式
dYs=μY(Yt;θ)dt+dWt, where μY(y;θ)=σ(γ−1(y;θ);θ)μ(γ−1(y;θ);θ)−21∂x∂σ(γ−1(y;θ);θ)
第二步, 中心化,去除尖峰影响。(Y→Z)
Z≡Δ−1/2(Y−y0)(3)
第三步,利用Hermite序列近似逼近Z的转移概率密度:
pZ(J)(Δ,z∣y0;θ)≡ϕ(z)j=0∑JηZ(j)(Δ,y0;θ)Hj(z)(4)
其中ϕ(z)≡e−z2/2/2π, 是标准的正态分布密度函数。而
Hj(z)≡ez2/2dzjdj[e−z2/2],j≥0(5)
是标准的Hermite序列。系数项可以如下的积分过程得到
ηZ(j)(Δ,y0;θ)≡(1/j!)∫−∞+∞Hj(z)pZ(Δ,z∣y0;θ)dz(6)
这里我想可以近似于傅里叶逼近来理解,毕竟Hermite序列也是正交序列。所以证明方法应该和傅里叶序列函数逼近差不多,因而我目前还不是特别好奇。
第四步,已知Z的状态转移密度,求Y的状态转移密度:(Z→Y)
根据(3)和(4):
pY(J)(Δ,y∣y0;θ)≡Δ−1/2pZ(J)(Δ,Δ−1/2(y−y0)∣y0;θ)(7)
第五步,已知Y的转移密度,得到X的转移密度:(Z→Y)
pX(J)(Δ,x∣x0;θ)≡σ(x;θ)−1pY(J)(Δ,γ(x,θ)∣γ(x0;θ);θ)(8)
第六步,最大化似然函数(**)。
以上即为Yacine似然估计的整个流程,而这里最重要也最复杂的就是第三步,如何通过序列逼近pZ(J)(Δ,z∣y0;θ)
通过较为简单的变量替换,我们有如下的结果
ηZ(j)(Δ,y0;θ)=(1/j!)∫−∞+∞Hj(z)pZ(Δ,z∣y0;θ)dz=(1/j!)∫−∞+∞Hj(z)Δ1/2pY(Δ,Δ1/2z+y0∣y0;θ)dz=(1/j!)∫−∞+∞Hj(Δ−1/2(y−y0))pY(Δ,y∣y0;θ)dy=(1/j!)E[Hj(Δ−1/2(Yt+Δ−y0))∣Yt=y0;θ]
这里,第二行的推导参照(7),可以反解出:
pZ(Δ,z∣y0;θ)=Δ1/2pY(Δ,Δ1/2z+y0∣y0;θ)(9)
第三行带入(3)即可。最后一行是期望的定义。然后最后一行的期望项用Tarlor公式展开:
E[f(Yt+Δ,y0)∣Yt=y0]=k=0∑KAk(θ)⋅f(y0,y0)k!Δk+E[AK+1(θ)⋅f(Yt+δ,y0)∣Yt=y0](K+1)!ΔK+1(10)
这里 f(y,y0)=Hj(Δ−1/2(Yt+Δ−y0)). 通过定义 (5),我们展开前七项的Hermite序列
H0(z) |
1 |
H1(z) |
-x |
H2(z) |
x2−1 |
H3(z) |
−x3+3x |
H4(z) |
x4−6x2+3 |
H5(z) |
−x5+10x3−15x |
H6(z) |
x6−15x4+45x2−15 |
而算子A=μy∂y∂+21∂y2∂2。这里ηZ(k,j)(Δ,y0;θ)有两个上标, k表示泰勒展开的阶数,j代表Hermite序列的阶数。Yacine在文章中给出了前七项的表达式,如图
还有第一项ηZ(0,3)=1;
ηZ(1,3)=−μYΔ1/2−(2μYμY[1]+μY[2])Δ3/2/4−(4μYμY[1]2+4μY2μY[2]+6μY[1]μY[2]+4μYμY[3]+μY[4])Δ5/2/24(a)
这里给出第二项的证明,其他项亦然:
泰勒展开(10), K=3:
A0f(y0,y0)+A1f(y0,y0)Δ+A2f(y0,y0)2!Δ2+A3f(y0,y0)3!Δ3+E[A3f(yt+δ,y0)]4!Δ4(a.1)
每一项计算如下:
A0f(y,y0)=H(Δ−21(y−y0))∣y=y0=Δ−21(y−y0)∣y=y0=0
A1f(y,y0)=μΔ−21
A2f(y,y0)=A(μΔ−21)=(μ∂y∂(μ)+21∂y2∂2(μ))Δ−21=(μμ(1)+μ(2))Δ−21
A3f(y,y0)=A((μμ(1)+μ(2))Δ−21)=(μ∂y∂(μμ(1)+μ(2))+21∂y2∂2(μμ(1)+μ(2)))Δ−21=21Δ−21(4μYμY[1]2+4μY2μY[2]+6μY[1]μY[2]+4μYμY[3]+μY[4])
带入以上的泰勒展开(a.1)即可得(a).
下面就来到了我头疼了两天的部分,(3)和(4)代入(7),我们会得到
pY(J)(Δ,y∣y0;θ)≡Δ−1/2ϕ(Δ−1/2(y−y0))j=0∑JηZ(j)(Δ,y0;θ)Hj(Δ−1/2(y−y0))(11)
把ηZ(k,j)(Δ,y0;θ)和Hj代入到(11),并且取出Δk的所有系数项。便可推导出这篇文章最最最重要的一个结论:
p~Y(K)(Δ,y∣y0;θ)=Δ−1/2ϕ(Δ1/2y−y0)exp(∫y0yμY(w;θ)dw)k=0∑Kck(y∣y0;θ)k!Δk(12*)
其中c0(y∣y0;θ)=0. 其他的项可以通过迭代算出
cj(y∣y0;θ)=j(y−y0)−j∫y0y(w−y0)j−1×{λY(w;θ)cj−1(w∣y0;θ)+(∂2cj−1(w∣y0;θ)/∂w2)/2}dw(12.1*)
其实,我深知直接用(12*)和(12.1*)就可以解决我大部分的问题,但是小编个人天生爱研究(找虐),居然脑补了两天这个是怎么凑出来的,也算是小有所获,但是今天比较晚了(妈妈叫我去喝牛奶),就先写到这里,明天晚上再继续补充这部分的笔记。
实,我深知直接用(12*)和(12.1*)就可以解决我大部分的问题,但是小编个人天生爱研究(找虐),居然脑补了两天这个是怎么凑出来的,也算是小有所获,但是今天比较晚了(妈妈叫我去喝牛奶),就先写到这里,明天晚上再继续补充这部分的笔记。
参考文献:
Maximum-Likelihood Estimation of Discretely-Sampled Diffusions: A Closed-Form Approximation Approach, Econometrica,2002, 70, 223-262 (this paper received the 1998 Cornerstone Research
Award)
链接:https://www.princeton.edu/~yacine/mle.pdf
结束语:本系列的文章是Yacine大神论文研究的读后感,不得不表达一下自己的崇拜之情,Yacine开源了自己所有的文章和程序,让大家使用和学习。超前的研究,超前的思想,虽然大神的境界不可企及,但是可以膜拜。哈哈,最重要的一点对自己说,从明天开始务正业,务正业!!!