原创 生成模型初探:從PCA到AE

生成模型初探:從PCA到AE   人類較機器蘊含智能,其中最重要的是一種創造性。無論是作詩繪畫還是音樂,藝術家都得在一定規則的限定下帶着腳鐐舞蹈,但是他們卻可以跳出少數幾個機械的規則,創造出無窮無盡的作品,這便是機械難以做到的事情。傳統的

原创 librosa打開文件是顯示NoBackendError

這是個老問題了,之前在服務器上和自己的舊電腦上都沒有,倒是換電腦之後在辦公室和自己的新電腦上都出現這個情況了。一種解決方式是,自己用wave庫寫一個讀wav的代碼,但是要全部替換項目裏面的源碼太麻煩了。後來才知道是ffmpeg庫的問題。在

原创 windows 下kaldi配置

      一個月前windows剛好宣傳了WSL2對GPU的支持,雖然WSL一直因爲對IO支持不佳被詬病,但是從簡潔性來看還是很值得想學linux但又不想配置虛擬機的同學們的。剛好自己想在本地配置個kaldi,這裏就介紹一下這一系列配置

原创 語音算法基礎:採樣、量化和頻譜

        想了很久該從哪裏開頭,那就從信號處理入手吧。         語音信號是連續的一維時間序列,幾十年前的語音處理系統都是模擬的,即通過各種電容電阻電感構建濾波器處理音頻,這種方法好處就是實時性好,但是太粗糙了。最初的bose

原创 關於語音算法專欄預告

        從大二進入聲學專業開始,本人就對語音算法產生了濃厚的興趣,當然剛開始也是因爲接了個語音分離的大創項目。現在兩年已經過去了,大創評了個優秀完美收官,同時自己也進入了智能音頻實驗室讀研,繼續相關的研究工作,我的畢業論文也是有關