微软推出了语音评测技术

2020年末中国在线教育市场规模预计将突破4300亿,同比增长18%。日前,微软推出了语音评测技术,据介绍,该技术广泛适用于教育领域的各种语言学习、口语练习和考试等场景,可从准确度、流利度、完整度来为用户上传的音频以及文本进行打分,让学生更高效的进行口语学习。

如何快速而有效地针对不同学生进行口语评测是线上线下的英语教学中遇到的一大挑战。在微软语音评测服务产品经理马莉莎看来,教育领域的语言学习存在两大痛点:国内的学生缺少外语为母语的专家的指导以及对发音等问题的及时纠正;国内的教师资源尤其是优质教师资源非常有限。

据马莉莎介绍,微软的语音评测技术便针对这两个痛点,进行资源整合,将优质师资力量整合到稳定的数字化的教学系统的技术,既能成为老师的好帮手,又能让学生得到有针对性的指导和反馈:

学生层面,微软在语音方面每个语言积累了10万多小时母语的数据,且参照的是全球的语言,准确度、专业性更高;语音评测技术支持对句子的—词—音素层层打分,同时针对漏读、误读的场景做了进一步的容错的优化,并基于自然语言模型的语义理解,给予学生精准的反馈。

老师层面,微软的语言的技术都是基于微软Azure云,Azure是全球拥有数据中心最多的,覆盖区域最多的云,它能够保护用户的数据安全性,能够在支撑用户大规模、大量的计算需求;该技术不仅能模拟母语专家打分,还能够学习到机构里其他老师们的评测方法,这样能够能够更合理地利用老师的时间,帮助老师线上线下多元化的服务教学。

好未来AI科学家胡翔宇也指出,“根据测试,微软语音服务的发音测评功能更好地适配了我们的收音环境,并且具备更高的一致性,更加贴近专家的评估结果。”

专业性、实时性、稳定性以及可定制性是语音评测服务竞争的重点。据微软亚太研发集团云计算与人工智能事业部产品总监丁秉公介绍,除上述外,微软的产品还有自己独特的优势:

除英文评测外,微软语音评测技术还支持全球 40 多个国家和地区的语言评测,覆盖全球主要语言;

算法而言,微软在某一些公开的测试上的语音识别错误率在5.1%左右,可以说达到了人类的水平;

微软的语音评测技术不仅仅是积累语音识别的基础技术,未来还会应用到包括知识图谱、语义理解、语义打分等技术。

今年以来,人们的工作方式和生活消费习惯悄然发生改变,远程办公、在线教育等新需求快速增加,展示出了数字经济所带来的巨大优势,也预示着教育行业正迈向数字化。马莉莎表示:“疫情加速了教育行业的数字化转型,当前很多企业将数字化的尖端技术带进数字化课堂。可以预见,未来AI和云计算赋能教育行业,会使得教师评估、作业练习、语言学习等传统场景更方便,可以期待更多样化、更个性化的服务走进每个学生、教室,走进整个的生态环境中,来帮助到学生更好的成长。”

微软语音评测的API有丰富的接口和参数,支持高实时率多并发调用。如果第三方想调用API,在前期评测环节是免费的,而进入集成开发阶段,会根据标准的Speech-To-Text(语音转文本)服务的价格,按照评测音频的时长来计费。

另外,丁秉公还提到,微软Azure内部有独立的Microsoft Education团队,专门针对教育领域提供不同的解决方案。除了语音评测外,Azure云在教育领域还有很多已落地的应用。

例如,疫情期间的“停课不停学”,让微软远程协作平台Microsoft Teams被学生用来作为远程学习的工具,在教育领域被广泛使用。
其次,在个性化教育方面,语音评测作为Azure上的服务,提供了个性化的打分能力,使在平台上使用这个功能的用户享受到属于他自己的独特服务。
第三,Azure的语音技术可以帮助合成AI老师,帮助教育机构生成课件,解决教育资源稀缺的问题。
除此之外,语音技术还可以帮助一些视障和听障学生更好地学习。
马莉莎认为,当前全球的教育行业都在进行数字化转型,疫情的到来加速了教育行业的数字化和线上化。通过让AI和云计算进一步赋能教育行业,可以为学生提供多元化个性化的服务,打造一个更加智能的生态环境。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章