中文分詞方面的重要文章

  1. Jianfeng Gao, Mu Lin, Andi Wu, Chang-Ning Huang, Chinese Word Segmentation: A Pragmatic Approach.  Microsoft Research 2004.
    這是微軟亞洲研究院對MSRSeg的實現方法的詳細描述,內容非常詳細。
  2. Hua-ping Zhang, Qun Liu, Chinese Lexical Analysis Using Hierarchical Hidden Markov Model. SIGHAN 2003. 這是對中科院計算所的ICTCLAS系統算法的描述,主要利用了分層HMM模型。
  3. Hua-ping Zhang, Qun Liu, Automatic Recognition of Chinese Unknown Words Based on Roles Tagging. 這是對ICTCLAS中命名實體和新詞的識別做出的解釋。
  4. Guohong Fu, Kang-Kwong Luke, Chinese Named Entity Recognition using Lexicalized HMMs. 關於HMM在命名實體識別中的描述。
  5. A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition。關於HMM的教程,比較詳細。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章