Github項目地址:https://github.com/deezer/spleeter
對於製作人,DJ以及任何想使用隔離音頻進行演奏的人來說,將歌曲拆分爲單獨的人聲和樂器一直是頭疼的問題。有很多方法可以執行此操作,但是該過程可能很耗時,並且結果通常不完美。如今,有一個全新的AI工具,可以簡單快速的解決這一難題,該軟件名稱就叫——Spleeter。
Spleeter是由法國的音樂流媒體公司Deezer開源,需向Spleeter提供一個音頻文件,它就會將其分成兩個、四個、五個等多個獨立的音軌,它支持mp3、wav、ogg等常見音頻格式。
Spleeter基於TensorFlow開發,本身運行速度非常快。分離過程可以在GPU或CPU上執行。在GPU上運行,如果它將音頻文件分成四個音軌,可以比實時速度快100倍。
安裝Spleeter並不難,只需克隆存儲庫並選擇用 Conda 環境安裝即可開始分離音頻文件,如下所示:
git clone https://github.com/Deezer/spleeter
conda envcreate-f spleeter/conda/spleeter-cpu.yaml
condaactivatespleeter-cpu
spleeter separate -i spleeter/audio_example.mp3 -p spleeter:2stems -ooutput
然後你就可通過選擇要執行的拆分類型,對你的文件進行處理,選項如下:
人聲(歌聲)/伴奏分離(兩個音軌)
人聲/鼓/貝斯/其他分離(四個音軌)
人聲/鼓/貝斯/鋼琴/其他分離器(五個音軌)
分離爲兩個/四個音軌的模型,在musdb數據集上具有最先進的性能,比實時速度快了100倍。
來源:開源最前線