筆記-2002-Combining Classifiers for Chinese Word Segmentation

Combining Classifiers for Chinese Word Segmentation

作者:Nianwen Xue,Susan P. Converse
單位:Institute for Research in Cognitive Science ;University of Pennsylvania 
出處:Proceeding SIGHAN '02 Proceedings of the first SIGHAN workshop on Chinese language processing - Volume 18 Association for Computational Linguistics Stroudsburg, PA, USA ©2002

主要內容:用最大熵解決中文分詞問題,拋磚引玉

引言,Introduction
模型,
1爲什麼用tag解決,怎麼tag
2 ME模型
3 ME有標記偏置問題,Transformation-Based Learning去解決
實驗
3個實驗的介紹
評價及結果分析
討論
使用最大熵工具注意幾點,
1 回車換行只有10 沒有13
2 測試語料不能有空行,可以對結果再行處理
3 測試語料如果第一行是測試答案,則輸出一個“標記”準確率,並不是P、R、F1
4 迭代次數可以顯示對訓練語料的擬合程度,Xue的這篇論文擬合程度至少是0.9755


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章