從PGM到HMM再到CRF(self_note)

原創

2018-09-04 11:01

問:
有一點不太明白想請教：MRF和CRF看起來好像就是p(x,y)和p(y|x)的差別，爲什麼他們兩個模型的應用差距那麼的大呢？MRF廣泛運用在各種領域，CRF大部分都用的linear

答：
忽略掉生成模型和判別模型的差別，如果只是給定了觀測變量X要計算隱變量Y的概率話，而不需要生成一個新的樣本的話，MRF和CRF確實是一樣的。很多論文裏用MRF，其實就是把MRF當成CRF用的，所以你說他們用的是MRF也行，說他們用的是general CRF也行。
Linear-Chain CRF的強勢主要是在自然語言處理中的強勢吧，因爲句子是一個單詞的序列嘛，自然是一維的線性結構（暫時不考慮語言中的從句等遞歸結構或者其他信息），不像圖像那樣是二維的，因此用不着general CRF。當然自然語言處理中也有用general CRF的，比如做命名實體識別，有一句話開頭是Green，你不知道這是個人名“格林”還是“綠色”這個詞放在句首所以要大寫。但如果這句話後面又出現了一個首字母大寫的Green，那就說明句首的Green很可能是個人名。所以可以除了在相鄰單詞之間連邊外，再加上在同一個詞的不同出現之間連邊，這時圖模型就有環了，變成了general CRF（這種叫skip-chain CRF）。
不過general CRF很難訓練呀，圖像處理裏面的MRF很多都是形狀規則的（格點形成一個矩形，近似推斷的時候可以固定其他點每次求某一列或者某一行變量的marginal），而skip-chain CRF邊的連接是不規則的，不同的句子的圖裏面環的個數和大小都可能不一樣，這就很麻煩了。（當然圖像處理的時候也有的用超像素把相似節點合併，這時候MRF的訓練就很麻煩了）加上也沒有什麼特別成熟的工具包來做skip-chain CRF的推斷（印象中CRF++和CRFSuite都只能處理LC-CRF），研究這個的人也就很少了。要建模那些複雜的遞歸或者引用關係的話，用CRF那麼複雜，現在大家都改用神經網絡了，比如LSTM，反正Keras搭個神經網絡也就幾十行代碼都不到，很快的。
——摘自知乎https://www.zhihu.com/people/SeptEnds/answers的回答。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

從PGM到HMM再到CRF(self_note)

PDManer [元數建模]-v4.9.0 發佈：一款簡單好用的數據庫建模平臺

使用neovim打造go ide(支持代碼跳轉, 代碼補全, 實時語法檢查)

sql求連續值問題

cs01 CSS Syntax

挑戰程序設計競賽 2.3章習題 poj 3046 Ant Counting

[MASM拾遺]Offset僞指令

h30 HTML Layout Elements

瞭解顯卡

一款基於C#開發的通訊調試工具（支持Modbus RTU、MQTT調試）

Linux/Golang/glibC系統調用

隨機網絡-無標度網絡（帶連接偏好的增長網絡模型）-(3)

Spark MLlib源碼分析—TFIDF源碼詳解

隨機網絡-概述與E-R模型-(1)

隨機網絡-小世界網絡（小世界網絡的協同動力學）概述-(2)

粗糙集，鄰域粗糙集與實域粗糙集概述

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結