kaldi 中文件讀取

* 1.  ark,scp文件

~/kaldi/src/featbin/copy-feats ark:raw_mfcc_dev.10.ark ark,t:-|head

ark存的試二進制文件,scp可以直接用cat命令看。


* 2.  fst文件

~/kaldi/tools/openfst-1.6.2/bin/fstprint L.fst | head -n 10 

~/kaldi/tools/openfst-1.6.2/bin/fstprint --isymbols=phones.txt --osymbols=words.txt L.fst | head -n 15

fstdraw [--isymbols=phones.txt --osymbols=words.txt] L.fst | dot –Tps  |  ps2pdf – L.pdf
~/kaldi/tools/openfst-1.6.2/bin/fstdraw --isymbols=phones.txt --osymbols=words.txt HCLG.fst


* 3.  mfcc 生成的文件

~/kaldi/src/featbin/copy-feats ark:raw_mfcc_test_hires.1.ark ark,t:- | head
在文件前邊加ark關鍵字,告訴copy-feats是什麼格式的,還有後面加一個ark,t:- 表示輸出格式爲t文本,否則默認是二進制。

~/kaldi/src/featbin/copy-feats ark:raw_mfcc_dev.10.ark ark:- |~/kaldi/src/featbin/add-deltas ark:- ark,t:- | head 
這樣可以看到40維的數據


* 4.  mdl文件

~/kaldi/src/gmmbin/gmm-copy --binary=false 0.mdl - 


* 5.  tree文件

~/kaldi/src/bin/copy-tree --binary=false tree -

~/kaldi/src/bin/draw-tree ../../data/lang/phones.txt tree | dot -Gsize=50,100 -Tps|ps2pdf - tree.pdf


* 6.   ali.1.gz 對齊文件

~/kaldi/src/bin/copy-int-vector "ark:gunzip -c ali.1.gz|" ark,t:- |head -n 1

可以先解壓 gunzip ali.1.gz
然後  ~/kaldi/src/bin/show-alignments ../../data/lang/phones.txt 40.mdl ark:ali.1 |head -n 2
可以看到類似於這種

原文:https://blog.csdn.net/qq_25867649/article/details/78356506 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章