原创 dual microphone wind noise reduction

coherence weighting use magnitude squared coherence(MSC) supression gain: limit gain function coherence based win

原创 網易2018語音算法筆試編程1

題目: 小易有一個長度爲N的正整數數列A = {A[1], A[2], A[3]…, A[N]}。 牛博士給小易出了一個難題: 對數列A進行重新排列,使數列A滿足所有的A[i] * A[i + 1](1 ≤ i ≤ N - 1

原创 matlab實現簡單清濁音檢測

清濁音檢測原理公式 清濁音檢測是在一段語音信號中區分出清音段、濁音段和靜音段。 原理框圖如下所示: 1.過零率: 2.對數能量 3.單位延遲自相關係數歸一化 4.lpc係數 使用Leveson-Durbin算法求得,取

原创 matlab實現以不同信噪比在乾淨語音信號中疊加噪聲

原理公式 信噪比計算公式: 信號功率和噪聲功率之比,也是信號幅度和噪聲幅度的平方之比。 一般情況下我們使用分貝的形式,即單位是dB,其值爲對數信號與噪聲功率比的十倍。 matlab實現代碼 function [y,noise]

原创 leetcode124.二叉樹中的最大路徑和

題目: 給定一個非空二叉樹,返回其最大路徑和。 本題中,路徑被定義爲一條從樹中任意節點出發,達到任意節點的序列。該路徑至少包含一個節點,且不一定經過根節點。 示例: 思路: post-order-traversal(後序遍歷)變

原创 DFSMN——Alibaba2018

論文:DEEP-FSMN FOR LARGE VOCABULARY CONTINUOUS SPEECH RECOGNITION Alibaba 2018 DFSMN 特點:跳層連接,更深的層數。和LFR結合。模型尺寸更小,低

原创 ubuntu爬坑

在Ubuntu中,有時候運用sudo apt-get install 安裝軟件時,會出現一下的情況 E: Could not get lock /var/lib/dpkg/lock - open (11: Resource t

原创 RNN BPTT算法推導

BPTT(沿時反向傳播算法)基本原理與BP算法一樣,包含三個步驟: 前向計算每個神經元的輸出值 反向計算每個神經元的誤差項δjδ_jδj​,它是誤差函數E對神經元j的加權輸入netjnet_jnetj​的偏導數 計算每個權重的梯度

原创 2.7.5lattice generation and n-best search

lattice生成和N-best搜索: 引用多種假設思想,使語音解碼器輸出多個得分較高的結果,然後再利用一些附加知識如當前狀態及談話主題選擇一個合理的結果。 multiple hypotheses在multi-pass decodin

原创 discriminative training鑑別性訓練

MLE(maximum likelihood estimation最大似然估計): 之前用於訓練HMM參數(A和B矩陣)所用的Baum-Welch算法和嵌入式訓練時基於最大化訓練數據的似然度的。MLE的替代方案是不再將最佳模型和數據相

原创 WebRTC AEC

AEC算法主要模塊: 1.回聲時延估計(用於自適應濾波器部分延時估計對齊) 2.NLMS濾波器(歸一化最小均方自適應算法),即PBFDAF(分段塊頻域自適應濾波算法)。 3.NLP是非線性濾波,取掉殘餘回聲。 4.CNG舒適噪聲產生

原创 給出n, m, 有兩種操作,n 減一 和 n 乘以 2,問最少要多少次操作才能把n 變成 m。

https://blog.csdn.net/castledrv/article/details/45305577 思路: n>m,最優方法是一直減1,返回n-m; n<m分組討論: 1.m爲奇數,讓m+1然後除以2; 2.當m爲偶數

原创 lattice

lattice 在實際的語音識別系統中,最優路徑不一定與實際字序列匹配,我們一般希望能夠得到得分最靠前的多條候選路徑,即N-best。爲了緊湊地保存候選路徑,我們一般採用lattice(詞圖)來保存識別的候選序列。lattice本質

原创 WebRTC NS

噪聲頻譜使用語音/噪聲似然函數進行估計。將接收到的每幀信號和頻率分量分類爲噪聲或語音。 NS主要用於寬帶,加性,有色噪聲。 WebRTC中NS是對語音/噪聲似然比(VAD檢測時就用了該方法)函數進行改進,將多個語音/噪聲分類特徵合併到

原创 語音識別——TDNN時延神經網絡

參考:http://www.inf.ed.ac.uk/teaching/courses/asr/lectures-2019.html https://blog.csdn.net/richard2357/article/details/