kaldi utils/filter_scp.pl腳本解釋

原創

2020-07-04 02:19

kaldi utils/filter_scp.pl腳本解釋

1 用法

# This script takes a list of utterance-ids or any file whose first field
# of each line is an utterance-id, and filters an scp
# file (or any file whose "n-th" field is an utterance id), printing
# out only those lines whose "n-th" field is in id_list. The index of
# the "n-th" field is 1, by default, but can be changed by using
# the -f <n> switch

用法：utils/filter_scp.pl utt.list utt2spk_all |sort -u > utt2spk
也可以這麼寫，加了一個<
新寫法：utils/filter_scp.pl < utt.list utt2spk_all |sort -u > utt2spk

utils/filter_scp.pl utt.list utt2spk_all |sort -u > utt2spk
utils/filter_scp.pl < utt.list utt2spk_all |sort -u > utt2spk

2 中文解釋

輸入參數【utt.list】 每行是一個utterance-id
輸入參數【utt2spk_all 】 每行是一個含有很多field字段的文本，其中第n序號字段是utterance-id
-f <n> 默認n爲1，即utt2spk_all 中的第1個字段就是utterance-id，可以自己指定

3 作用

將utt2spk_all 中 滿足utterance-id在utt.list中 的行給導出並重新生成給utt2spk文件

而 utt.list生成 可以從文本轉寫txt中得到，用以下命令：

awk '{print $1}' transcripts.txt > utt.list

transcripts.txt內容
transcripts.txt是一個以空格隔開的含有兩個字段（分別是utterance-id、text）的多行文本
通過awk打印出第一個字段（utterance-id）到utt.list

4 注意

awk 列數下標默認從1開始
其實utils/filter_scp.pl的作用是，utt2spk_all表和 utt.list表(id表)【取交集】

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

kaldi utils/filter_scp.pl腳本解釋

kaldi utils/filter_scp.pl腳本解釋

1 用法

2 中文解釋

3 作用

4 注意

自學編程兩個月，現在我月入 4 萬元

百度安全多篇議題入選Blackhat Asia以硬技術發現“芯”問題

「實戰應用」如何用圖表控件LightningChart創建2D氣泡圖

Google Chrome驅動程序 124.0.6367.62（正式版本）去哪下載？

kaldi utils/filter_scp.pl腳本解釋

Kaldi腳本utils/int2sym.pl解釋

Excel單擊單元格就進入編輯

ubuntu vim打開自動輸入p問題

記錄一下二分混淆矩陣

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結