原创 筆記-2007-基於有效子串標註的中文分詞

基於有效子串標註的中文分詞 作者:趙海,接春雨 單位:香港城市大學- 出處:中文信息學報,2007年,21卷,5期,8-13頁 本文主要是確定什麼做子串;特徵6Tag:B,B2,B3,M,E,S;僅CRF結果 評價數據:Sighan ba

原创 筆記-2004-Adaptive Chinese Word Segmentation

Adaptive Chinese Word Segmentation 作者:Jianfeng Gao,Andi Wu,Mu Li,Chang-Ning Huang,Hongqiao Li,Xinsong Xia,Haowei Qin 單位

原创 筆記-2003-Chinese Word Segmentation as Character Tagging

Chinese Word Segmentation as Character Tagging 不知道這篇是不是上一篇的擴寫,發表在不同雜誌上 作者:Nianwen Xue 單位:Inst. for Research in Cognitiv

原创 筆記-2003-Chinese Word Segmentation as LMR Tagging

Chinese Word Segmentation as LMR Tagging 作者:Nianwen Xue,LibinShen 單位:Inst. for Research in Cognitive Science;University

原创 fwscanf在vc6與2005上的差別

按固定的格式讀入數據函數 int fscanf( FILE *stream, const char *format [, argument ]... ) int fwscanf( FILE *stream, const wchar_

原创 筆記-2012-Fast Online Training with Frequency-Adaptive Learning Rates for CWS and New

Fast Online Training with Frequency-Adaptive Learning Rates for Chinese Word Segmentation and New Word Detection 作者:香港理

原创 常用被引用文獻 MIRA CRF

MIRA (Margin Infused Relaxed Algorithm )一種超保守在線算法, 在分類、排序、預測等應用領域取得不錯成績 理論 Koby Crammer.2004. Online Learning of Com-

原创 筆記-2011-A New Unsupervised Approach to Word Segmentation

A New Unsupervised Approach to Word Segmenation Hanshi Wang, Jian Zhu, Shiping Tang, XiaoZhong Fan 北京理工大學,2011 發在CL上 長度

原创 形式語義學-chapter 3 Attribute Grammars

ATTRIBUTE GRAMMARS 屬性文法 前言: 1968年被Donald Knuth 提出,當時的目的是爲了對上下文無關的語義進行形式化。現在多用於類似:檢查聲明,檢查變量or函數是否與聲明一致,操作語義等。 靜態語義形式化描述最

原创 筆記-2012-Unsupervized Word Segmentation the case for Mandarin Chinese

 Unsupervized Word Segmentation the case for Mandarin Chinese Pierre Magistry ,Benoit Sagot 法國的,2012在ACL上發表 左右熵,差值,歸一化

原创 筆記-2006-Subword-based Tagging by Conditional Random Fields for Chinese Word Segmentation

Subword-based Tagging by Conditional Random Fields for Chinese Word Segmentation 作者: Ruiqiang Zhang,Genichiro Kikui ,Ei

原创 筆記-2009-An Error-Driven Word-Character Hybrid Model for Joint CWS and POS Tagging

An Error-Driven Word-Character Hybrid Model for Joint Chinese Word Segmentation and POS Tagging 作者:神戶大學,Canasai Kruengk

原创 筆記-2002-Combining Classifiers for Chinese Word Segmentation

Combining Classifiers for Chinese Word Segmentation 作者:Nianwen Xue,Susan P. Converse 單位:Institute for Research in Cogni

原创 10月小事

長輩    早高峯的公交車,一個字“擠”。還好有樂觀的公交司機大叔“您要是着急就努力往上擠啊,不着急就等下一輛”。    早高峯的三環,也就一個字“堵”。    不知道擠了多久,又堵了。聽見前面司機在跟某人喊話,好像類似“師傅,您挪一下,

原创 筆記-1999-消解中文三字長交集型分詞歧義的算法

消解中文三字長交集型分詞歧義的算法 出處:清華大學學報(自然科學版)1999年第5期 單位:清華大學 作者:孫茂松 三字,交搭歧義,詞性,詞概率,組合概率,分類詞表概率主要內容: 根據對一個1億字漢語語料庫的觀察, 三字長交集型分詞歧義