人聲提取工具Spleeter安裝教程（Linux）

上一篇文章介紹了Spleeter這款強大的人聲提取工具：

這應該是目前最好的人聲提取工具，沒有之一！

這篇文章就來分享一下安裝的教程。因爲在linux環境下安裝spleeter相對要簡單很多，這篇教程先以Ubuntu20.04系統介紹（在win系統下可以使用VMware虛擬機安裝Ubuntu，之前永恆君也寫過教程：

傳送門在這裏

）

在安裝之前，要確保運行Spleeter的計算機系統是64位，Spleeter不支持32位的系統。Linux：可以通過 uname --m命令查看，windows則可以在我的電腦 - 屬性中進行查看。

在安裝好Ubuntu20.04系統之後，就可以開始下面的步驟了。

安裝步驟

1、下載並安裝Anaconda

1-1 下載

Spleeter是基於python語言的工具，而Anaconda就是可以便捷獲取python包且對包能夠進行管理，同時對環境可以統一管理的發行版本，可以大大減少因爲包等依賴項的問題而造成的困擾，提升效率。可以簡單理解，Anaconda可以更方便的進行安裝Spleeter。

進入官網：
https://www.anaconda.com/products/individual

選擇linux - Python 3.7 - 64-Bit (x86) Installer

如果上面的網站訪問慢的話，可以試試這個清華大學的鏡像站https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/

選擇linux的即可

下載下來是一個以.sh結尾的文件，這個是在linux系統中的腳本文件，類似於windows系統中的.exe文件。

1-2 安裝

1）在.sh所在的文件夾點擊右鍵，打開終端，輸入命令 bash + sh文件名，.sh文件名字要換成你自己的，如：

bash Anaconda3-2019.10-Linux-x86_64.sh

2）按照提示，需要看一些條款，一路回車即可。

然後會問你是否同意條款，當然輸入yes，不然呢？

系統提示安裝的默認位置，一般直接回車即可

然後就進入安裝的過程，稍等一會

接下來提示是否要初始化，一般輸入yes

到這個界面，就說明安裝成功了。

1-3 修改配置文件condarc

這樣下載比較快。（因爲源文件都在國外的服務器上，速度經常會不穩定）。

在終端裏面輸入命令：

sudo gedit ~/.condarc

或者在主目錄下面，找到.condarc文件並打開，將下面的內容粘貼進去：

channels:
  - defaults
show_channel_urls: true
channel_alias: https://mirrors.tuna.tsinghua.edu.cn/anaconda
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

2、安裝Spleeter

2-1 建議爲Spleeter創建單獨的運行環境，名稱取爲music，並激活。
（這一步非必須，可直接進行步驟2-2安裝Spleeter）

爲了程序的穩定性，建議先通過Anaconda創建一個環境專門用來運行Spleeter，這個永恆君命名爲music，使用python3.7。

打開終端，輸入

conda activate base
conda create -n music python=3.7 #創建一個python3.7的環境，名字爲music

完成之後，激活music環境，終端輸入

conda activate music

2-2 終端輸入下面的命令，安裝Spleeter

這個過程視網絡情況，可能需要耐心等待一會。

conda install -c conda-forge spleeter

出現下面的提示，就說明安裝完成了。

3、下載訓練模型（一定要注意存放的路徑）

第一次分離音軌前需要給Spleeter一個“示範”，需要有個pretrained models(預訓練模塊)。

下載地址：
https://github.com/deezer/spleeter/releases

分離人聲的話一般只需要2軌,下載圖上2stems即可。

在主目錄下面新建pretrained_models\2stems路徑文件夾，將下載的模型文件解壓到文件夾裏面。

如果你使用的是4stems、5stems，則要相對應的在pretrained_models文件夾下面建立4stems、5stems文件夾。

4、分離提取人聲

把需要分離的原始音樂文件 ppxhn.mp3 放在主目錄，然後終端鍵入命令運行：

spleeter separate -i ppxhn.mp3 -p spleeter:2stems -o output

使用的是4stems、5stems的話，只需要把上面命令2stems改成4stems或者5stems即可。

出現下面的字樣就說明提取成功了，在主目錄下面會生成一個output\ppxhn的文件夾

accompaniment.wav是提取的背景
vocals.wav是提取的人聲

小結一下

1、安裝Anaconda，修改配置文件condarc。
2、安裝Spleeter
3、下載訓練模型
4、分離提取人聲

其它問題：

1、32位win系統無法使用，64位系統可以使用，建議搭配64位的Python程序或者Anaconda。

2、訓練模型如果下載很慢，可以建議使用GitHub文件加速下載地址轉換：https://shrill-pond-3e81.hunsh.workers.dev/

轉換後使用idm等下載即可。

下載成功後在主目錄下依次建立文件夾 pretrained_models\2stems，將2stems.tar.gz解壓縮後放置到這個文件夾中即可。

類似地也可建立文件夾並放置模型文件：
pretrained_models\2stems-finetune
pretrained_models\4stems
pretrained_models\4stems-finetune
pretrained_models\5stems
pretrained_models\5stems-finetune

-finetune這種是更爲精確的高質量模型，使用方法也一樣。

3、拆分類型選項

2stems、4stems、5stems三種分別對應分成2軌、4軌和5軌
人聲（歌聲）、伴奏分離（2個音軌）
人聲、鼓、貝斯、其他分離（4個音軌）
人聲、鼓、貝斯、鋼琴、其他分離（5個音軌）

4、支持的音頻文件有mp3、wav、ogg

5、一次分離多個文件（比較費資源，不推薦）

spleeter separate \
     -i <path/to/audio1.mp3> <path/to/audio2.wav> <path/to/audio3.ogg> \
     -o audio_output

歡迎交流！

人聲提取工具Spleeter安裝教程（Linux）

安裝步驟

1、下載並安裝Anaconda

2、安裝Spleeter

3、下載訓練模型（一定要注意存放的路徑）

4、分離提取人聲

一行代碼快速實現文件共享！

網易雲音樂，灰色歌曲也能聽！

Word居然可以這樣製作填空題，太快了！

word中這樣查找“李博”，就不會找到“李博海”啦~

這兩款文本識別工具，太好用了值得收藏！

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結