原创 筆記-2007-基於有效子串標註的中文分詞
基於有效子串標註的中文分詞 作者:趙海,接春雨 單位:香港城市大學- 出處:中文信息學報,2007年,21卷,5期,8-13頁 本文主要是確定什麼做子串;特徵6Tag:B,B2,B3,M,E,S;僅CRF結果 評價數據:Sighan ba
原创 筆記-2004-Adaptive Chinese Word Segmentation
Adaptive Chinese Word Segmentation 作者:Jianfeng Gao,Andi Wu,Mu Li,Chang-Ning Huang,Hongqiao Li,Xinsong Xia,Haowei Qin 單位
原创 筆記-2003-Chinese Word Segmentation as Character Tagging
Chinese Word Segmentation as Character Tagging 不知道這篇是不是上一篇的擴寫,發表在不同雜誌上 作者:Nianwen Xue 單位:Inst. for Research in Cognitiv
原创 筆記-2003-Chinese Word Segmentation as LMR Tagging
Chinese Word Segmentation as LMR Tagging 作者:Nianwen Xue,LibinShen 單位:Inst. for Research in Cognitive Science;University
原创 fwscanf在vc6與2005上的差別
按固定的格式讀入數據函數 int fscanf( FILE *stream, const char *format [, argument ]... ) int fwscanf( FILE *stream, const wchar_
原创 筆記-2012-Fast Online Training with Frequency-Adaptive Learning Rates for CWS and New
Fast Online Training with Frequency-Adaptive Learning Rates for Chinese Word Segmentation and New Word Detection 作者:香港理
原创 常用被引用文獻 MIRA CRF
MIRA (Margin Infused Relaxed Algorithm )一種超保守在線算法, 在分類、排序、預測等應用領域取得不錯成績 理論 Koby Crammer.2004. Online Learning of Com-
原创 筆記-2011-A New Unsupervised Approach to Word Segmentation
A New Unsupervised Approach to Word Segmenation Hanshi Wang, Jian Zhu, Shiping Tang, XiaoZhong Fan 北京理工大學,2011 發在CL上 長度
原创 形式語義學-chapter 3 Attribute Grammars
ATTRIBUTE GRAMMARS 屬性文法 前言: 1968年被Donald Knuth 提出,當時的目的是爲了對上下文無關的語義進行形式化。現在多用於類似:檢查聲明,檢查變量or函數是否與聲明一致,操作語義等。 靜態語義形式化描述最
原创 筆記-2012-Unsupervized Word Segmentation the case for Mandarin Chinese
Unsupervized Word Segmentation the case for Mandarin Chinese Pierre Magistry ,Benoit Sagot 法國的,2012在ACL上發表 左右熵,差值,歸一化
原创 筆記-2006-Subword-based Tagging by Conditional Random Fields for Chinese Word Segmentation
Subword-based Tagging by Conditional Random Fields for Chinese Word Segmentation 作者: Ruiqiang Zhang,Genichiro Kikui ,Ei
原创 筆記-2009-An Error-Driven Word-Character Hybrid Model for Joint CWS and POS Tagging
An Error-Driven Word-Character Hybrid Model for Joint Chinese Word Segmentation and POS Tagging 作者:神戶大學,Canasai Kruengk
原创 筆記-2002-Combining Classifiers for Chinese Word Segmentation
Combining Classifiers for Chinese Word Segmentation 作者:Nianwen Xue,Susan P. Converse 單位:Institute for Research in Cogni
原创 10月小事
長輩 早高峯的公交車,一個字“擠”。還好有樂觀的公交司機大叔“您要是着急就努力往上擠啊,不着急就等下一輛”。 早高峯的三環,也就一個字“堵”。 不知道擠了多久,又堵了。聽見前面司機在跟某人喊話,好像類似“師傅,您挪一下,
原创 筆記-1999-消解中文三字長交集型分詞歧義的算法
消解中文三字長交集型分詞歧義的算法 出處:清華大學學報(自然科學版)1999年第5期 單位:清華大學 作者:孫茂松 三字,交搭歧義,詞性,詞概率,組合概率,分類詞表概率主要內容: 根據對一個1億字漢語語料庫的觀察, 三字長交集型分詞歧義