端到端語音識別
• Espnet: https://github.com/espnet/espnet • 實現了主流的端到端語音識別方法
• Speech-Transformer、LAS、CTC、RNN-T
• 一個小缺點:代碼量已經越來越多...
• 實踐:有GPU機器的話,可以跑一下egs下面的aishell1/2
• Speech Transformer: https://github.com/kaituoxu/Speech-Transformer
• Listen, Attend and Spell: https://github.com/kaituoxu/Listen-Attend-Spell