原创 audacity VS2010 工程搭建

audacity的 VS2015工程網上已經有了,https://blog.csdn.net/weixin_34224941/article/details/93950373 按照這個instructions就可以搭建一個比較穩定的vs2

原创 聲卡內錄工具之 Audio Record Wizard

這幾天小弟在搞海康、大華的視頻流分析,剝離其中的音頻聲道通道內容分析 大廠有時候喜歡玩小裝13,不用通用格式,用ffmpeg分析不出來音頻流,後來想想,硬解決音頻stream extract,還得用sdk,算了,找到內錄工具直接錄下來簡單

原创 盛大哼唱檢索前端提取算法分析

  盛大開源頭算法 https://github.com/owensss/sdhumming 兩隻老虎的片段 pitch提取, 求diff ,插值等   五點均值化   後處理 resample 去除很小接近0的的,都給磨平 除去毛刺

原创 fftw3/gsl庫中傅里葉變換/反傅里葉變換函數和Matlab中的fft/ifft的對應關係

先分析一維度的 一、fftw_plan_dft_1d 正變換:  fftw_complex *in = fftw_malloc ( sizeof ( fftw_complex ) * n );  fftw_complex *out = f

原创 再議GMM和HMM的一些用法

推薦murphy的工具箱,這篇博客是根據大牛的工具箱使用寫一些note Kevin Murphy 現在在Google brain工作,曾在MIT lab工作,他是 Machine Learning: a Probabilistic Per

原创 卡爾曼濾波之我見

最近簡單看了一下kalman濾波,這裏先寫些筆記 卡爾曼濾波說的是“兩套系統“得到的計算量或者測量量,一個是根據系統狀態預測出來的下一個狀態的各種參量,另一個是實際測量值,那麼我們怎麼在這兩套系統中找到更合適的值。 說白了,它所謂的這兩套

原创 Aurora2 語音數據庫的建立

        Aurora2 語音數據庫 經常在學術上被用來作爲評測數據庫,很多語音識別的base數據庫,HTK的訓練模型數據庫,VAD,基頻檢測都用Aurora2語音數據庫。        Aurora2語音數據庫的具體情況可以參考

原创 再議Uniform FFT modulated filterbank

前面寫過一篇文章,但是感覺對於FFT 的filterbak還是沒有說清楚,這邊就再次把自己的一些理解說一下 1、這裏麪包含的幾個概念 uniform,說明就是基礎濾波器就一個,其他濾波器是它的一個變體,也就是調製(modulated)出來

原创 Matlab壞了?國慶小修Matlab小毛病

奇了怪了,今天用Matlab,不能雙擊打開m文件了 不用也沒有什麼啊,直接用Matlab editor 是可以打開的 但是隻能先打開Matlab中的editor再把m文件拖到editor裏面去。。。。,用用就不爽了 奇了怪了,馬上Bai

原创 中秋無事,小破一個時間限制的軟件

偶然從網上的一個某家語音合成的工具,效果還可以,只是軟件試用期只到2013年: 已經說明白了,2013年就不能用了 對於一般人,改改系統時間,用用就得了,但是對於作爲程序員的我來說是不可以接受的,一定要作一下,把它破解掉 先用偵殼工具

原创 fftw中的fft和ifft的對應關係

只分析一維度的 一、fftw_plan_dft_1d 正變換:  fftw_complex *in = fftw_malloc ( sizeof ( fftw_complex ) * n );  fftw_complex *out = f

原创 動態範圍規劃(調整)Dynamic Range Control的一些心得(一)

動態範圍規劃(規整、調整)Dynamic Range Control或者Dynamic Range Processor,在信號處理或者語音處理領域中,用的非常普遍了,但是想仔細理解一下里面的一些設置、用法。還是需要一些心思好好研究一下的

原创 動態範圍規劃(調整)Dynamic Range Control的一些心得(三)

應該來說,經過上兩次的描述,一個DRC應該初具規模了,不過要考慮DRC作用的完備性,還得深耕細作呢。 前面從幅度變化方面做了大量的工作,實際上DRC作用時,還得考慮時間問題 attack和release時間就是專門做這個的,一般來說,

原创 高斯混合模型(GMM model)以及梯度下降法(gradient descent)更新參數

關於GMM模型的資料和 EM 參數估算的資料,網上已經有很多了,今天想談的是GMM的協方差矩陣的分析、GMM的參數更新方法 1、GMM協方差矩陣的物理含義 涉及到每個元素,是這樣求算: 用中文來描述就是: 注意後面的那個除以(樣本數-1

原创 動態範圍規劃(調整)Dynamic Range Control的一些心得(四)

這章節說說DRC的高級玩法吧,"分bandDRC"或者說"Multi-band DRC" 前面闡述的DRC都是在時域做處理,沒有涉及到頻域,對於一些特殊的場合,需要對高低頻(或者更多)頻帶做不同的DRC增益,這時候就需要考慮到分ban