原创 SpecAugment
論文地址:https://arxiv.org/pdf/1904.08779.pdf Augmentation Policy 我們旨在構建一種直接作用於log mel頻譜圖的增強策略,以幫助網絡學習有用的功能。 出於以下目的的動機:
原创 transformer-XL 介紹
http://pytorch123.com/FifthSection/Translation_S2S_Network/
原创 pytorch rnn lstm
http://pytorch123.com/FifthSection/Translation_S2S_Network/
原创 pytorch 簡單入門
@[toc](文章目錄) # 12345 前言: 最近一直在用pytorch 訓練端到端的語音識別系統(https://github.com/espnet/espnet),目前效果還不錯,在相同的數據集上,和kaldi的差距一個點
原创 20190911
ipcs -m ps -aux | grep 8895 python worker.py -u ws://localhost:8895/worker/ws/speech -c conf/asr_worker.yaml
原创 20190827
質檢數據篩選:/home/homework/wangshenjian/daily_zhijian_collect 發送:192.168.240.104(test-09機器):disk2/wangshenjian/upload
原创 解碼流程
語料位置:133 :/mnt/data3/wangqq/16_208_backup/workspace/wangqq/lm_training/G 生成語言模型: arpa2fst --disambig-symbol=#0 --read
原创 數據讀取,去除中文字母數字之外符號,並分詞
# encoding=utf-8 import jieba import optparse import re,codecs def main(): parser = optparse.OptionParser()
原创 語言模型
ngram語言模型有兩個難以逾越的鴻溝,數據稀疏與缺乏長距離語言約束 rnn:可以獲得長距離信息,但是很難獲得風場距離的信息,理由是隨着長度的增加,遠距離信息通過概率相乘的結果趨向於零
原创 20190702
fst文檔: SPEECH RECOGNITIONWITHWEIGHTED FINITE-STATE TRANSDUCERS Efficient WFST-Based One-Pass Decoding With On-The-Fly H
原创 0613
mysql查詢時間select * from files where fname=date_format(date_sub(curdate(),interval 2 day),'%Y%m%d'); mysql> select * fro
原创 0612
insert overwrite directory "bos://zyb-offline/user/wangzhou/sale_staff" select id, sc_uid, leads_id, course_id, trans_t
原创 WFST 動態解碼
WFST:Speech recognition with weighted finite-state transducers 靜態解碼: 動態解碼:Look-Ahead Composition,On-the-fly Rescoring L
原创 kaid mfc特徵
計算13維度特徵 if [ $stage -le 6 ]; then for part in call_center_26s; do steps/make_mfcc.sh --cmd "$train_cmd" --nj 1
原创 on-the-fly 動態解碼
1.靜態解碼: composition determinization minimization 2. 語言模型重評估: 文章《電話交談語音識別中基於LSTM-DNN語言模型的重評估方法研究》 聲學模型只能識別語音信號中音素、音節、或者詞