CRF模型

英文原文:http://blog.echen.me/2012/01/03/introduction-to-conditional-random-fields/
參考文章:http://www.jianshu.com/p/55755fc649b1

對該文章的總結

CRF模型的核心由兩部分組成:

  1. 特徵函數(制定標註序列的規則)
  2. 標註序列 ( 爲問題的解空間)

線性鏈CRF模型的特徵函數:

f(s,i,li,li1)
  1. 輸入包含4個參數:s(句子) , i (句子的第i個詞), Li(當前標註序列標註句子s第i個詞的詞性),Li-1(當前標註序列標註句子s第i-1個詞的詞性)
  2. 輸出有兩種可能:0(不符合特徵)1(符合特徵)

  3. 線性鏈的CRF模型的計算公式如下

    score(l/s)=j=1mi=1nλjfj(s,i,li,li1)

    (實質就是用一個標註序列用在一個句子上的情況下,用所有的特徵函數遍歷一遍的評分)

CRF模型比HMM的強大之處

  1. HMM是CRF模型的一種形式,非常接近線性鏈CRF
    HMM的計算公式如下:

    p(l,s)=p(l1)ip(li|li1)p(wi|li)

    其中:p(li |li1 )是轉移概率(transition_probability),比如,li1 是介詞,li 是名詞,此時的p表示介詞後面的詞是名詞的概率。
    p(wi |li )表示發射概率(emission_probability),比如li 是名詞,wi 是單詞“ball”,此時的p表示在是名詞的狀態下,是單詞“ball”的概率。
  2. CRF可以自定義特徵函數,而不是隻是考慮標註序列的前後二元結構,從而可以制定出更加考慮全局性的特徵函數

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章