weka 使用命令行

使用命令行(推薦) 
雖然使用圖形界面查看結果和設置參數很方便,但是
最直接最靈活的建模及應用的辦法仍是使用命令行。 
打開“Simple CLI”模塊,像上面那樣使用“J48”算法的命令格式爲: 
java weka.classifiers.trees.J48 -C 0.25 -M 2 -t directory-path\bank.arff -d directory-path \bank.model 
其中參數“ -C 0.25”和“-M 2”是和圖形界面中所設的一樣的。“-t ”後面跟着的是訓練數據集的完整路徑(包括目錄和文件名),“-d ”後面跟着的是保存模型的完整路徑。注意!這裏我們可以把模型保存下來。 
輸入上述命令後,所得到樹模型和誤差分析會在“Simple CLI”上方顯示,可以複製下來保存在文本文件裏。誤差是把模型應用到訓練集上給出的。 
把這個模型應用到“bank-new.arff”所用命令的格式爲: 
java weka.classifiers.trees.J48 -p 9 -l directory-path\bank.model -T directory-path \bank-new.arff 
其中“-p 9”說的是模型中的待預測屬性的真實值存在第9個(也就是“pep”)屬性中,這裏它們全部未知因此全部用缺失值代替。“-l”後面是模型的完整路徑。“-T”後面是待預測數據集的完整路徑。 
輸入上述命令後,在“Simple CLI”上方會有這樣一些結果: 
0 YES 0.75 ?
1 NO 0.7272727272727273 ?
2 YES 0.95 ?
3 YES 0.8813559322033898 ?
4 NO 0.8421052631578947 ?
...
 
這裏的第一列就是我們提到過的“Instance_number”,第二列就是剛纔的“predictedpep”,第四列則是“bank-new.arff”中原來的“pep”值(這裏都是“?”缺失值)。第三列對預測結果的置信度(confidence )。比如說對於實例0,我們有75%的把握說它的“pep”的值會是“YES”,對實例4我們有84.2%的把握說它的“pep”值會是“NO”。 
我們看到,使用命令行至少有兩個好處。一個是可以把模型保存下來,這樣有新的待預測數據出現時,不用每次重新建模,直接應用保存好的模型即可。另一個是對預測結果給出了置信度,我們可以有選擇的採納預測結果,例如,只考慮那些置信度在85%以上的結果。 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章