原创 SpecAugment

論文地址:https://arxiv.org/pdf/1904.08779.pdf Augmentation Policy 我們旨在構建一種直接作用於log mel頻譜圖的增強策略,以幫助網絡學習有用的功能。 出於以下目的的動機:

原创 transformer-XL 介紹

http://pytorch123.com/FifthSection/Translation_S2S_Network/

原创 pytorch rnn lstm

http://pytorch123.com/FifthSection/Translation_S2S_Network/

原创 pytorch 簡單入門

@[toc](文章目錄) # 12345 前言:     最近一直在用pytorch 訓練端到端的語音識別系統(https://github.com/espnet/espnet),目前效果還不錯,在相同的數據集上,和kaldi的差距一個點

原创 20190911

ipcs -m ps -aux | grep 8895 python worker.py -u ws://localhost:8895/worker/ws/speech -c conf/asr_worker.yaml

原创 20190827

質檢數據篩選:/home/homework/wangshenjian/daily_zhijian_collect 發送:192.168.240.104(test-09機器):disk2/wangshenjian/upload      

原创 解碼流程

語料位置:133 :/mnt/data3/wangqq/16_208_backup/workspace/wangqq/lm_training/G   生成語言模型: arpa2fst --disambig-symbol=#0 --read

原创 數據讀取,去除中文字母數字之外符號,並分詞

# encoding=utf-8 import jieba import optparse import re,codecs def main(): parser = optparse.OptionParser()

原创 語言模型

ngram語言模型有兩個難以逾越的鴻溝,數據稀疏與缺乏長距離語言約束 rnn:可以獲得長距離信息,但是很難獲得風場距離的信息,理由是隨着長度的增加,遠距離信息通過概率相乘的結果趨向於零

原创 20190702

fst文檔: SPEECH RECOGNITIONWITHWEIGHTED FINITE-STATE TRANSDUCERS Efficient WFST-Based One-Pass Decoding With On-The-Fly H

原创 0613

mysql查詢時間select * from files where fname=date_format(date_sub(curdate(),interval 2 day),'%Y%m%d'); mysql> select * fro

原创 0612

insert overwrite directory "bos://zyb-offline/user/wangzhou/sale_staff" select id, sc_uid, leads_id, course_id, trans_t

原创 WFST 動態解碼

WFST:Speech recognition with weighted finite-state transducers 靜態解碼: 動態解碼:Look-Ahead Composition,On-the-fly Rescoring L

原创 kaid mfc特徵

計算13維度特徵 if [ $stage -le 6 ]; then for part in call_center_26s; do steps/make_mfcc.sh --cmd "$train_cmd" --nj 1

原创 on-the-fly 動態解碼

1.靜態解碼: composition determinization minimization 2. 語言模型重評估: 文章《電話交談語音識別中基於LSTM-DNN語言模型的重評估方法研究》 聲學模型只能識別語音信號中音素、音節、或者詞