台部落翁卓

http://pytorch123.com/FifthSection/Translation_S2S_Network/

2020-06-28 17:10:32

普通RNN: lstm: 那麼參數個數 n 爲： n = 4 * ((x_dim + y_dim) * y_dim + y_dim)

2020-06-28 17:10:32

驗證了一個端到端語音識別系統，目前cer結果還不錯。考慮怎麼實際使用： 1）服務器端：利用kaldi的流式處理方法（http目錄1. kaldi-gstreamer-server2. master_server.py3. wok

2020-06-28 17:10:21

https://blog.csdn.net/hestendelin/article/details/105384299

2020-06-28 17:10:20

http://pytorch123.com/FifthSection/Translation_S2S_Network/ https://zhuanlan.zhihu.com/p/44121378 1.3 Positional Encodi

2020-06-28 17:10:20

見過很多獲取服務器本地IP的代碼，個人覺得都不是很好。從網上搜索到一個靠譜的腳本，分享一下！通過 UDP 獲取本機 IP，目前見過最優雅的方法這個方法是目前見過最優雅獲取本機服務器的IP方法了。沒有任何的依賴，也沒有去猜測機器上的網絡

2020-06-28 17:10:19

一.搭建見博客 http://www.luyixian.cn/news_show_274565.aspx 二. 結構 1) master worker client 利用websocket交互 2) g

2020-06-08 13:03:25

m4a 及其他轉MP3 流程首先 ffmpeg 轉成wav ffmpeg -y -i apple.m4a -ac 1 -ar 16000 apple.wav # 蘋果m4a格式轉成單通道 16k採樣率的wav格式音頻

2020-06-08 13:03:25

要想整個模型是確定性的，我們需要設定好隨機種子，這樣當程序運行到具有random的模塊時，由於僞隨機的種子是相同的，那麼隨機得到的結果也是相同的。需要設定的隨機種子如下。 def set_seed(self, seed

2020-05-22 10:16:25

目錄Abstract1. Introduction2. Model2.1. Convolutional Front-end2.2. Convolutional Acoustic Model2.3. Convolutional La

2020-05-15 15:33:03

整理知乎 https://www.zhihu.com/people/leonjin 回答，如侵權立刪音速擾動sp：將音頻速度擴展爲0.9,1.0,1,1 參考腳本utils/data/perturb_data_dir_speed_

2020-05-12 01:01:09

查看原文 https://www.infoq.cn/article/BK9LZ7b4txmsOTCQ-vLm Wav2Letter 的核心是個聲學模型，就像我們也許已經猜到的那樣，它可以預測聲波中的字母

2020-05-08 09:21:15

半監督學習文章：https://zhuanlan.zhihu.com/p/37747650 自我學習 (self-training) 自我訓練就是通過一系列的步驟，用已有的有標籤的數據(labelled data)，去對剩下的還未標記的數

2020-05-08 09:21:15

目錄ABSTRACT1. INTRODUCTION3. SEMI-SUPERVISED SELF-TRAINING3.1. Filtering3.2. Ensembles4. EXPERIMENTSdata4.2. Experim

2020-05-08 09:21:15

作者分別來自俄亥俄州立大學，Salesforce，亞馬遜 alexa，還是值得一讀目錄ABSTRACTINTRODUCTIONSUPERVISED LEARNING FOR ASR2.1 End-to-end ASR wit

2020-05-02 20:41:58