原创 X-Vector 數據增益方法

X-Vector 數據增益方法 論文:Snyder D, Garcia-Romero D, Sell G et al. X-Vectors: Robust DNN Embeddings for Speaker Recogniti

原创 文本無關說話人確認的深度神經網絡嵌入

文本無關說話人確認的深度神經網絡嵌入 論文:Snyder D, Garcia-Romero D, Povey D, et al. Deep Neural Network Embeddings for Text-Independe

原创 SincNet 原始波形的說話人識別

SincNet 原始波形的說話人識別 論文:M. Ravanelli, Y. Bengio, in 2018 IEEE Spoken Language Technology Workshop, SLT 2018 - Procee

原创 端到端的文本無關說話人確認的深度神經網絡嵌入

端到端的文本無關說話人確認的深度神經網絡嵌入 論文:Snyder D, Ghahremani P, Povey D, et al. Deep neural network-based speaker embeddings for

原创 跨信道文本無關說話人識別的信道對抗訓練

跨信道文本無關說話人識別的信道對抗訓練 文獻:X. Fang, L. Zou, J. Li, L. Sun, and Z. Ling, “Channel Adversarial Training for Cross-channe

原创 PyTorch頻譜特徵工具 spectra_torch

spectra_torch 鏈接:https://github.com/mechanicalsea/spectra 摘要 Github 提供了 C++ 版本和 Python Numpy 版本的語音頻譜特徵提取工具,給深度模型設

原创 端到端的文本相關說話人確認

端到端的文本相關說話人確認 論文:Heigold G, Moreno I, Bengio S, et al. End-to-end text-dependent speaker verification[A]. ICASSP,

原创 2019 年中國研究生數學建模競賽 F 題

2019 年中國研究生數學建模競賽 F 題 題目:多約束條件下飛行器航跡快速規劃 摘要:針對飛行器航跡規劃問題,考慮誤差校正點約束與飛行轉彎半徑約束,設計滿足飛行規則與約束的航跡規劃路徑,優化航跡長度最與經過的校正點次數。該問題

原创 可解釋的卷積濾波器 SincNet

可解釋的卷積濾波器 SincNet Ravanelli, M. 在 NIPS 2018 進一步討論了 SincNet 可解釋意義,令人感覺該模型已經能夠勝任在說話人識別的基礎上勝任更多的語音處理任務。因此,在先前的 SincNet

原创 VoxCeleb 說話人識別挑戰

VoxCeleb 說話人識別挑戰 VoxSRC 消息: 2020 VoxCeleb Speaker Recognition Challenge (VoxSRC) 將聯合 Interspeech 國際會議於 2020 年 10 月

原创 Chapter 8. MATLAB圖形用戶界面設計

題目來自《MATLAB程序設計與應用》第二版 劉衛國 Chapter 8 MATLAB圖形用戶界面設計 課後習題解答 1. 圖形窗口與座標軸 課堂討論 在同一圖形窗口建立兩個座標軸 分別用axes函數和axis函數在同一圖形窗

原创 Chapter 9. Simulink系統仿真

題目來自《MATLAB程序設計與應用》第二版 劉衛國 Chapter 9 Simulink系統仿真 課後習題解答 1. Simulink仿真基礎 課堂討論 利用Simulink對函數曲線進行仿真 利用 Simulink 仿真下

原创 對抗判別式領域自適應

對抗判別式領域自適應 論文鏈接:https://ieeexplore.ieee.org/document/8099799/ 文獻:E. Tzeng, J. Hoffman, K. Saenko, and T. Darrell,

原创 PyTorch-Kaldi 深度學習語音識別開源軟件

PyTorch-Kaldi 深度學習語音識別開源軟件 論文:Ravanelli M (Mirco Ravanelli), Parcollet T, Bengio Y. The Pytorch-kaldi Speech Recog

原创 開集文本無關的說話人識別

開集文本無關的說話人識別 文章目錄開集文本無關的說話人識別摘要引言方法MCE 2018 數據結果與討論相關文獻 摘要 開集文本無關的說話人識別旨在利用語音技術來檢測某一語音是否來自系統中的已註冊人員,並確定是來自其中的哪一名說話人