CRF++分詞實現

如何在windows下測試一下CRF++工具包的例子
(1)首先下載CRF++工具包 下載地址
(2)可以先拿example中的某個例子,做一下測試。例如:example中chunking文件夾,其中原有4個文件:exec.sh;template;test.data;train.data。
template爲特徵模版;
test.data爲測試數據;
train.data爲訓練數據。
(3)可以選擇example裏的某個例子做測試,比如選chunking。將crf_learn.exe;crf_test.exe;libcrfpp.dll三個文件複製到到,含有exec.sh;template;test.data;train.data的文 件夾(chunking)裏。
cmd
cd進入該文件夾
crf_learn -a MIRAtemplate train.data model 訓練數據
crf_test -m model test.data >output.txt 測試數據
這裏調用conlleval.pl時候,注意output.txt中文件之間的分割符,“\t”,可以將其換成“ ”;
執行conlleval.pl < output.txt 評估效果;
或者直接執行 conlleval.pl -r -d “\t”

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章