原创 NLMS及MDF AEC中核心理論點突破

如需轉載請註明出處。 本文從數學和物理意義上闡明NLMS及頻域MDF AEC中步長更新的深層理論含義。 以speex AEC爲例,以回聲泄露因子來計算得到最優步長。 r = st->leak_estimate*st->Yf[i];  

原创 FFT變換中的頻譜泄露問題研究

如需轉載,請註明出處。 以下內容爲個人理解,如有出入,還望一同探討。 核心基本原理: 1. 卷積定理: 時域信號的乘積,映射爲頻域信號的卷積;頻域信號的乘積,映射爲時域信號的卷積 2. 基本概念: 離散傅里葉變換( DFT & FF

原创 求局部極值的小技巧

nbr = np.zeros(len(vec)+1, dtype=bool) nbr[0] = True nbr[1:-1] = np.greater_equal(vec[1:], vec[:-1]) maxmask = (nbr[:-

原创 Comb+All-pass filter組合Reverberation中Comb feedback係數校正

如需轉載請註明出處! 當前,介紹或實現Comb+All-pass Filter Revereration的文章有很多,但是由於不嚴謹的引用和非邏輯性推導,造成Comb feedback係數嚴重錯誤,誤人視聽。本文的主要目的是就Comb

原创 H264—MP4格式及在MP4文件中提取H264的SPS、PPS及碼流

一、MP4格式基本概念 MP4格式對應標準MPEG-4標準(ISO/IEC14496)   二、MP4封裝格式核心概念 1  MP4封裝格式對應標準爲 ISO/IEC 14496-12(信息技術 視聽對象編碼的第12部分: IS

原创 python函數參數引用傳遞

 首先還是應該科普下函數參數傳遞機制,傳值和傳引用是什麼意思?    函數參數傳遞機制問題在本質上是調用函數(過程)和被調用函數(過程)在調用發生時進行通信的方法問題。基本的參數傳遞機制有兩種:值傳遞和引用傳遞。   值傳遞(pas

原创 Ubuntu loop login解決方法

如需轉載請註明出處! 最近在Ubuntu上用到MXNet做些實驗,本來爲了GPU加速運算安裝了CUDA,從此入坑...... 重新登陸Ubuntu發現Unity登陸使用陷在loop login,輸入密碼回到登陸界面,無限反覆。通過Ct

原创 基於內容-基於音頻特徵的音頻檢索

如需轉載請註明出處! 一. 算法可用性 1. 能夠由片段識別主體 2. 檢索準確率高 3. 抗噪性強   二. 算法基本原理     離線階段,對音頻數據庫中所有音頻樣本提取指紋,構建hash table;在線階段,通過對待查詢音頻

原创 音質檢測的算法創新與實現

如需轉載請註明出處! 近來做音質檢測相關的研究工作,預期以算法自動篩查的方法過濾掉大規模音頻庫中的參數劣質音頻,並作爲後續新上傳音頻的音質檢測門檻,最終在一定程度上保障參數優質音頻。 獨創了音質檢測算法(至今已有的資料還未看到有相同

原创 GMM模型初探

如需轉載請註明出處! GMM的初探,有理論出入的地方還請見諒並指正,提前謝過! 基礎部分預習:1. 行列式 2. 協方差與協方差矩陣 實際工程實現中,對於離散的隨機變量,由於實際的採樣數據量是有限的,因此對於描述統計特性的

原创 依賴靜態庫,編譯生成動態庫

如需轉載請註明出處! 直入主題,目標是依賴靜態庫,編譯動態庫,最終生成二進制文件。 文件目錄如下: 文件內容組織: add.c #include "add.h" int add(int a, int b) { int

原创 c語言 float 保留小數點後兩位數字

挺實用的小技巧。 float sp = 36.51647; sp=( (float)( (int)( (sp+0.005)*100 ) ) )/100; 轉載地址:http://blog.163.com/szliug@yeah/b

原创 語音增強算法研究系列(一):MMSE-STSA 音頻降噪

如需轉載,請註明出處! 創建CSDN博客專欄的流程過於繁瑣,爲了節省時間,以系列文章的方式總結對語音增強算法的研究,主要包含語音降噪與回聲消除算法。 MMDE-STSA:  參考文獻:Speech Enhancement Using

原创 基於內容的音頻場景分割

如需轉載,請註明出處! 從音頻場景分割的複雜度上來講,最有難度的爲 speech+song VS song 之間的分割。 speech+song: 前景爲人說話,背景爲singing song speech+song  VS song

原创 語音增強算法研究系列(四):非平穩噪聲消除

如需轉載,請註明出處! 創建CSDN博客專欄的流程過於繁瑣,爲了節省時間,以系列文章的方式總結對語音增強算法的研究,主要包含語音降噪與回聲消除算法。   參考文獻:Speech enhancement for non-stati