Voxceleb2 視頻數據集下載(國內鏈接)

最近需要用到voxceleb2的視頻數據集做點東西, 但是發現從官網下載實在太過於費勁, 好不容易下載下來, 將將近300GB的文件切片上傳至百度雲. 希望能對需要這個數據集做事情的童鞋有點幫助. ^.^

1. 寫在前面

我們使用的是牛津大學Zisserman大神率領的團隊做的 <Voxceleb2: Deep Speaker Recognition>[1] 數據集的視頻部分(因爲我主要是做圖像, 視頻這塊的…).

VoxCeleb2爲超過6,000名名人提供超過100萬個話語,上傳到YouTube。該數據集具有性別平衡,61%的發言者爲男性。發言者涉及各種不同的種族,口音,專業和語言。數據集中包含的視頻是在大量具有挑戰性的視覺和聽覺環境中拍攝的。其中包括紅地毯,室外體育館和安靜的室內工作室的採訪,大量觀衆的演講,專業拍攝多媒體的摘錄,甚至是手持設備拍攝的粗略視頻。喋喋不休,歡笑,重疊的語音和不同的房間聲學。我們還爲數據集中的說話人提供面部檢測和麪部軌跡,並且面部圖像在野外也是類似的,具有姿勢(包括輪廓),光照,圖像質量和運動模糊的變化。

下圖是Voxceleb2數據的分佈情況, 可以看出, 男性數據佔整體的61%, 女性佔整體的39%. 在國籍方面, 美國29%排名第一, Voxceleb2主要以歐洲人爲主.
在這裏插入圖片描述

在這裏插入圖片描述
在這裏插入圖片描述
對Voxceleb2的音頻和視頻文件的差別, 我有1句總結: " Voxceleb2的音頻和視頻是對應的同樣的文件, 只不過視頻文件是既有視頻, 也有對應的音頻, 但沒有字幕. “”

此外, 由於視頻數據量過大 (將近300G), 下載非常麻煩, 耗費了我將近2周, 在別人的幫助下才終於搞定. 於是我決定將其上傳到百度雲, 供需要的童鞋下載, 減輕他們的痛苦.
在這裏插入圖片描述

voxceleb2數據集概率圖在這裏插入圖片描述

2. 官方下載流程

當然, 如果你有強大的手段能高速的下載voxceleb2數據集, 可以直接從官方下載.

  • ① 先填寫一個表格, 獲取下載所需的賬號和密碼. 填完會很快收到如下內容的郵件(馬賽克部分即爲賬號密碼)
    在這裏插入圖片描述

  • ② 得到賬號密碼後, 即可在voxceleb2鏈接[2]下下載視頻數據了, 可以用網頁下載, 也可以用命令行 wget -c xxxx(地址) --user xxx --password xxx 進行下載, -c是斷點續傳功能, 因爲數據量太大, 避免下載中斷.

  • ③ 將voxceleb deva到devi都下載完畢後, 需要使用cat vox2_dev* > vox2_mp4.zip得到260G左右的壓縮包, 將其解壓即可得到145569個視頻片段. 我們就可以對此進行處理, 來適配自己的任務了. (下面是我的處理日誌)
    在這裏插入圖片描述

3. 網盤

因爲下載實在麻煩, 而且每個分卷都是30GB, 超出了百度網盤單個文件的上限, 因此我將壓縮包vox2_mp4.zip分解爲15G的壓縮卷, 將其上傳到百度雲上. 供大家下載使用, 減少痛苦~

下載完畢後, 使用cat voxceleb2_a* > vox2_mp4.zip, 然後再解壓vox2_mp4.zip即可得到視頻文件.

參考文獻

[1] J. S. Chung*, A. Nagrani*, A. Zisserman <VoxCeleb2: Deep Speaker Recognition>
[2] The VoxCeleb2 Dataset

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章