原创 kaldı、kaldi-ctc的安裝(CUDA+CUDNN)

操作系統:Ubuntu14.04(64位) 顯卡:GTX750Ti CUDA版本:7.5(後綴爲cuda_7.5.18_linux.run)(截止2019-3-1,kaldi僅支持cuda7.5和cuda8.0) CUDNN版本:5.1(

原创 語音識別中的詞錯率(SER)以及字錯率(WER)

1.句錯率 句錯率(Sentenct Error Rate,SER):如果識別的句子與標準句子中由任意一個字不對應,那麼這句話就是錯的,錯的句子個數除以總句子個數即爲句錯率。 公式如下:                         

原创 ffmpeg 錯誤修正

1.Unable to find a suitable output format for 'strict -2' strict -2: Invalid argument 2.The encoder 'aac' is experiment

原创 dnn+i-vector在kaldi中的實現。

需要三行腳本,你可以一行做一個腳本文件,這樣就不需要每次提取特徵都要重新訓練1步驟和2步驟的模型了。 1:steps/online/nnet2/train_diag_ubm.sh --cmd "$train_cmd" data/train

原创 kaldi 數據準備錯誤集

問題1:utils/validate_data_dir.sh: file data/sre/utt2spk is not in sorted order or has duplicates 解決方法: 解決方法,你可以這樣試一下。 uti

原创 mysql linux遠程訪問

第一步:首先鏈接本機的mysql(用ssh登錄終端,輸入如下命令): mysql -uroot -p 輸入密碼登陸進去後,輸入如下的語句,執行。 grant all privileges on *.* to ‘user‘@’%‘ iden

原创 kaldi dnn

1.如果你要跑dnn,那麼你的訓練數據集必須大於300條,不然會莫名其妙的出錯。(這個錯花了我1天的時間)2.如果你要用score.sh來對你的 dan's dnn 模型進行解碼,那麼在執行解碼decode.sh之前,你需要cp exp/

原创 語音識別之語料準備

首先要制定好音頻的格式,比如:Mono(單聲道),16000hz(採樣率),音頻格式爲wav。 接着,錄音的時候一定要慢!不要太快,如果太快的話識別率會很低。

原创 timit實例的運行

首先安裝ubuntu14.04平臺,安裝好後就開始安裝各種kaldi需要的組件,代開終端,在其中輸入如下代碼 安裝前的配置    sudo apt-get install libtool    sudo apt-get install

原创 kaldi mfcc

Kaldi特徵提取之-預處理背景本質上語音信號是一維的時間信號,隨時間上下波動。現實中,人們再說話時會受到各種音素的干擾,爲了進一步進行處理,我們必須進行必要的預處理以便之後的特徵提取。諸如FBank,MFCC,PLP等都需要經過預處理步

原创 kald腳本解釋

數據準備 譯者:V ([email protected])  水平有限,如有錯誤請多包涵。   @wbglearn校對。 介紹 在運行完示例腳本後(見Kaldi tutorial),你可能會想用自己的數據在Kaldi上跑一下。本節主

原创 GMM-HMM理解

本文簡明講述GMM-HMM在語音識別上的原理,建模和測試過程。這篇blog只回答三個問題: 1. 什麼是Hidden Markov Model? HMM要解決的三個問題: 1) Likelihood 2) Decoding 3)

原创 kaldi-ctc的安裝、編譯、測試

操作系統:Ubuntu14.04(64位)顯卡:GTX750TiCUDA版本:7.5(後綴爲.deb)CUDNN版本:5.1(for cuda 7.5)(後綴爲.tgz)(以上文件均在官網下載,顯卡驅動在你安裝cuda的時候就會自動安裝(

原创 基於kaldi的在線語音識別

本文是基於kaldi的在線語音識別,使用b/s架構進行在線識別。適用於剛剛接觸的小白。開發環境:jdk-1.8,Ubuntu16.04,Eclipse。開發過程:(1)準備必須的文件如果你想要實現在線語音識別功能在kaldi下,那麼你需要

原创 kaldi 說話人自適應

自適應的作用是,補償實際數據與已經訓練的三音素模型中聲學條件不匹配的問題,包括說話人特性(說話方式、口音等)及環境特性(如錄音設備、房間混響等)。在GMM-HMM模型中,自適應方法有特徵空間變換和模型空間變換。Kaldi中主要採用的是特徵