【導讀】CMU近日發佈大規模語音數據集,提供音頻、對齊文本和單詞發音的700多種不同語言的數據集。平均而言,每種語言提供大約20個小時的句長的轉錄。
數據爬取自:http://www.bible.is/
List of Languages with relative scores of accuracy of alignment
http://festvox.org/cmu_wilderness/
Map of Languages geopositioned
http://festvox.org/cmu_wilderness/map.html
Github鏈接地址:
https://github.com/festvox/datasets-CMU_Wilderness
-END-