音頻數據永久分享

音頻數據集官網

RAVDESS   https://smartlaboratory.org/ravdess

SAVEE   http://kahlan.eps.surrey.ac.uk/savee/Download.html

數據說明:

SAVEE數據集
AudioData,包含四個男性的數據KL、JK、JE和DC,數據條數分別爲120條。每個人說了七種情緒類別各有15或者30個句子。文件名的首字母表示emotion類
,後面的數字表示句子編號。字母“a”、“d”、“f”、“h”、“n”、“sa”和“su”分別代表“憤怒”、“厭惡”、“恐懼”、“快樂”、“中性”、“悲傷”和“驚訝”等情緒類別。例如,“d03.wav'是第三個令人厭惡的句子。

AudioVisualClip,說明同上,多了男演員說話的視頻,不止是聲音。

RAVDESS數據集
語音文件(Audio_Speech_Actors_01-24。zip, 215 MB)包含1440個文件:每個參與者60次試驗 *  24個參與者= 1440。歌曲文件(Audio_Song_Actors_01-24。包含1012個文件:每個參與者44次試驗 * 23個參與者= 1012。

文件的名字(例如:02-01-06-01-02-01-12)的解釋如下:
模態(01 =全音視頻,02 =視頻,03 =音頻)。
聲道(01 =演講,02 =歌曲)。
情緒(01 =中性,02 =冷靜,03 =快樂,04 =悲傷,05 =憤怒,06 =恐懼,07 =厭惡,08 =驚訝)
情緒強度(01 =正常,02 =強烈)。注意:中性情緒沒有強度。
語句(01 =“孩子們在門旁邊說話”,02 =“狗坐在門旁邊”)。
重複(01 =第一次重複,02 =第二次重複)。
演員(01 - 24個人的編號)。奇數演員是男性,偶數演員是女性)。
文件名的例子:02 - 01 - 06 - 01 - 02 - 01 - 12.mp4 視頻(02)演講(01)恐懼(06)正常(01)狗坐在門旁邊(02)第一次重複(01)演員編號(12)女,因爲演員的身份證號碼是偶數。
注意:
語言包括平靜、快樂、悲傷、憤怒、恐懼、驚訝和厭惡的表情,而歌曲包含平靜、快樂、悲傷、憤怒和恐懼的情緒。每個情緒都有兩個層次的情緒強度(正常、強烈),外加一箇中性的表情。

百度網盤鏈接

RAVDESS

鏈接:https://pan.baidu.com/s/1n7Pnx7DVXD-vtJ464R0VPQ 
提取碼:2gqv 

SAVEE
鏈接:https://pan.baidu.com/s/1gE9gx4YbWdPRphEBb-GBGw 
提取碼:4gqk

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章