CMU多語種語音數據集:700多種語言的語音/文本對齊語料

【導讀】CMU近日發佈大規模語音數據集,提供音頻、對齊文本和單詞發音的700多種不同語言的數據集。平均而言,每種語言提供大約20個小時的句長的轉錄。

數據爬取自:http://www.bible.is/

List of Languages with relative scores of accuracy of alignment

http://festvox.org/cmu_wilderness/

Map of Languages geopositioned

http://festvox.org/cmu_wilderness/map.html

Github鏈接地址:

https://github.com/festvox/datasets-CMU_Wilderness

-END-

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章