package hmm.model;
import hmm.bean.HMMHelper;
import util.TCMMath;
/**
* 【改进后的前向算法】
* 【带比例因子修正的前向算法 :计算观察序列的概率 】
* 【注意】 改进后,就没必要使用后向算法来求观测序列概率了,直接利用中间比例因子scale就可以求得,在改进的前向算法中以写logProb()函数
*
* 前向算法:
* 目的:
* 1、先计算前向变量矩阵
* 2、再用前向变量矩阵 来 计算一个观测序列的概率
*/
public class ForwardWithScale extends HMM{
public int[] O;//观测序列observe//如yellow red blue yellow green 这些在enum Color {red,yellow,blue,green }的索引位置
public double[][] alpha; //前向变量矩阵
public double[] scale;//用于修正的比例因子——从带比例因子修正后的前向算法计算
/**
* flag 表示 A和B是否是自然对数化(lnX) true: A和B自然对数化后传进来 false: A和B未自然对数化
*/
public ForwardWithScale(double[][] A, double[][] B, double[] PI, int[] O, boolean flag){
super(A, B, PI, flag);
this.O=O;
}
public ForwardWithScale(HMM hmm, int[] O){
super(hmm);
this.O=O;
}
/**
* 【计算前向变量矩阵】
* 在时间 t 的条件下,hmm输出观察序列O(1)O(2)...O(t)且该时间t下的隐藏状态为s_i(第i个隐藏状态,共N种隐藏状态)的概率
* alpha[ t ][ i ] = alpha_t( i ) = log(P(O(1)O(2)...O(t), q_t=s_i | λ))
*/
public void CalculateForeMatrix(){
int T = O.length;
alpha = new double[ T ][ N ];//每一时刻(每行)上 可能出现的多个状态的发生的前向变量概率
scale = new double[ T ];//【比例因子】
scale[ 0 ] =Double.NEGATIVE_INFINITY;
//1、初始化,计算初始时刻(直觉上的第1时刻)所有状态的局部概率
for (int i = 0; i < N ; i++){
alpha[ 0 ][ i ] = logPI[ i ] + logB[ i ][ O[ 0 ] ];
/*******************增加部分*****************/
scale[ 0 ] = TCMMath.logplus( scale[ 0 ] , alpha[ 0 ][ i ]);
}
/*******************增加部分*****************/
for(int i=0; i< N; i++){//利用比例因子归一化
alpha[ 0 ][ i ] -= scale [ 0 ];
}
//2、归纳,递归计算每个时间点的局部概率
for (int t = 1; t < T; t++){//从(直觉上的第2时刻)即t=1(下标从0开始)观测值算起——第时间t下开始循环
scale[ t ] = Double.NEGATIVE_INFINITY;
for (int j = 0; j < N; j++) {//
double sum = Double.NEGATIVE_INFINITY; // = log(0)
for (int i = 0; i < N; i++){//到第 i 种隐状态下的累计概率
//sum+=alpha[ t-1 ][ i ] * A[ i ] [ j ]
sum = TCMMath.logplus( sum, alpha[t - 1][ i ] + logA[ i ][ j ]);
}
//alpha[ t ][ j ] = 【t-1时刻 所有 隐藏状态 i 】到达 【t时刻 隐藏状态 j】并【t时刻显示出O( t )】的前向变量概率
//alpha[ t ] [ j ] = ∑ ( alpha[ t-1 ][ i ] * A[ i ] [ j ] ) *B[ j ] [ O(t) ] 求和符号表示 1<=i <=N
alpha[ t ][ j ] = logB[ j ][ O[ t ] ] + sum;//在 【t 时刻】 下 输出观察序列 O1O2……Ot(已知观测序列的局部) 且位于第 j 种隐藏状态发生的概率
/*******************增加部分*****************/
scale[ t ] = TCMMath.logplus( scale[ t ] , alpha[ t ][ j ]);//比例因子
}
/*******************增加部分*****************/
for (int j = 0; j < N; j++) {//利用比例因子归一化
alpha[ t ][ j ] -= scale [ t ];
}
}
}
/**
* 【计算观测序列的概率】——返回的是自然对数
*/
public double logProb() {
//3、终止,求概率就直接使用比例因子求得
int T = O.length;
double sum = 0; // = log(1)
for(int t=0; t< T; t++){
sum += scale[ t ];
}
return sum;
}
/**
* 【计算观测序列的概率】——前提是先计算前向变量矩阵
* P( O | μ ) = ∑alpha_T( i ) (求和上界N,求和下界i=1)
* @return 返回的结果是概率的自然对数
* 计算 t=T 时刻下输出观察序列 O0……OT(已经观测序列的局部)且位于第 T 状态下发生的概率
public double logProb() {
//3.终止,观察序列的概率等于最终时刻( T )所有局部概率之和
double sum = Double.NEGATIVE_INFINITY; // = log(0)
int T = O.length;
for (int i = 0; i < N; i++){
sum = TCMMath.logplus(sum, alpha[ T-1 ][ i ]);//下标从0开始
}
return sum;
}
*/
/**
* 打印前向变量矩阵
*/
public void print() {
for (int j = 0; j < N; j++) {
for (int i = 0; i < alpha.length; i++){
System.out.print(HMMHelper.fmtlog(alpha[ i ][ j ]));
}
System.out.println();
}
}
Reference
宗成庆.统计自然语言处理