原创 語音合成——文天祥 指南錄

今天測試語音合成樣本的時候,合了文天祥的指南錄,聽了之後非常感動。 非常感慨,以前讀書的時候都沒這種體會。 雖然合成還有很多問題,但還是跟大家分享一下,與君共勉。 音頻 文天祥 指南錄 微調節奏後 文本: 嗚呼!予之生也幸,而幸生

原创 對話系統——基於神經網絡的NER命名實體識別

基於神經網絡的實體識別概述模型實現數據下載並解壓讀取數據庫準備字典建立數據生成器Mask的使用搭建卷積神經網絡padding執行訓練 概述 項目地址:https://github.com/audier/my_nlp_play

原创 深度學習入門——tensorflow和keras的基本使用

深度學習入門項目一、TensorFlow入門——實現MNIST1. 項目背景2. 項目數據3. 數據處理4. 模型選擇與建模1)模型選擇DNN2)模型輸入及參數3)模型結構4)損失函數和優化器5)模型訓練並保存5. 評估準則與效果

原创 語音識別——使用python建立HMM-GMM孤立詞識別模型

基於HMM-GMM的孤立詞識別簡介基礎準備python建模數據預處理特徵提取搭建孤立詞模型模型的訓練和測試hmmlearn安裝報錯一些想法 簡介 本文實現了一個基於HMM-GMM的獨立詞識別模型,數據集有限,訓練數據爲獨立詞,爲

原创 語音識別——kaldi HMM-GMM全部訓練腳本分解

文章目錄train_mono.shtrain_deltas.shtrain_lda_mllt.shtrain_sat.sh train_mono.sh 單音素訓練腳本: //初始化,[topo feats] -> [0.mdl t

原创 NLP——利用lstm生成莫言小說

利用lstm生成莫言小說 1. 項目背景 這個項目是建立一個能夠自動生成一片文章的深度學習模型,我們可以通過給出錢幾個字就自動生成一篇文章的模型。 項目地址:https://github.com/audier/my_deep_pr

原创 語音識別——kaldi基於GMM的單音素模型 訓練部分

文章目錄1. gmm-init-mono 模型初始化2. compile-train-graghs 訓練圖初始化3. align-equal-compiled 特徵文件均勻分割4. gmm-acc-stats-ali 累積模型

原创 語音識別——基於深度學習的中文語音識別(自注意力機制的語言模型代碼實踐)

文章目錄基於自注意力機制的語言模型1. 數據處理2.模型搭建2.1 構造建模組件layer norm層embedding層multihead層feedforwardlabel_smoothing.2.2 搭建模型3. 訓練模型3.

原创 語音識別——kaldi 模型訓練工具整理

文章目錄 ##acc-tree-stats Accumulate statistics for phonetic-context tree building. Usage: acc-tree-stats [options] <

原创 語音識別——kaldi GMM模型解碼指令 gmm-latgen-faster詳解

文章目錄 ##- 作用: Generate lattices using GMM-based model. 生成基於GMM模型的lattice詞格) ##- 用法: Usage: gmm-latgen-faster [opti

原创 語音識別——kaldi學習 一腳本流學習工具使用

文章目錄yesno訓練分塊詳解首先進行特徵提取:然後,準備訓練所需的詞典,音素文件,詞文件等。生成聲學拓撲結構。訓練單音素模型最後合成語言模型:建立解碼腳本 kaldi中腳本東西比較多,一層嵌一層,不易閱讀。 本文以yesno爲

原创 語音識別——kaldi解碼及特徵提取詳解

文章目錄1. 注意事項2. 流程圖:3. 具體流程指令: 1. 注意事項 首先要訓練好模型,用到3個文件,分別是: final.mdl(訓練模型得到的模型文件) final.mat(用來特徵轉換) HCLG.fst(fst文件

原创 NLP——基於transformer 的翻譯系統

文章目錄基於transformer 的翻譯系統1. 數據處理1.1 英文分詞1.2 中文分詞1.3 生成字典1.4 數據生成器2. 構建模型2.1 構造建模組件layer norm層embedding層multihead層feed

原创 語音識別——kaldi - Online Audio Server(服務器客戶端建立方法-舊版在線解碼)

文章目錄一、服務器客戶端識別系統建立方法1. Command line to start the **server**(服務器端啓動方式):1.1 Arguments are as follow(參數意義):2. Command

原创 語音識別——kaldi常用文件查看指令

文章目錄1. ark特徵文件2. FST文件 資料來自kaldi官方文檔。 轉載註明出處。 1. ark特徵文件 copy-feats 可以用來改變特徵數據的格式,因此可以轉換ark格式文件爲txt格式: 用法: cop