CMU多语种语音数据集:700多种语言的语音/文本对齐语料

【导读】CMU近日发布大规模语音数据集,提供音频、对齐文本和单词发音的700多种不同语言的数据集。平均而言,每种语言提供大约20个小时的句长的转录。

数据爬取自:http://www.bible.is/

List of Languages with relative scores of accuracy of alignment

http://festvox.org/cmu_wilderness/

Map of Languages geopositioned

http://festvox.org/cmu_wilderness/map.html

Github链接地址:

https://github.com/festvox/datasets-CMU_Wilderness

-END-

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章