详细内容或原文请订阅后点击阅览
InterSpeech 2025语音可访问性项目挑战
虽然过去十年见证了自动语音识别(ASR)系统的显着进步,但对于言语障碍的人来说,这些系统的性能仍然不足,部分原因是公共培训数据有限。为了弥合这一差距,发起了2025年间言语语音可访问性项目(SAP)挑战,利用了400多个小时的SAP数据收集和转录的500多个患有多样化语音障碍的人。 SAP Challenge托管在evalai并利用远程评估管道上,根据单词错误率评估提交的内容…
来源:Apple机器学习研究虽然过去十年见证了自动语音识别(ASR)系统的显着进步,但对于言语障碍的人来说,这些系统的性能仍然不足,部分原因是公共培训数据有限。为了弥合这一差距,发起了2025年间言语语音可访问性项目(SAP)挑战,利用了400多个小时的SAP数据收集和转录的500多个患有多样化语音障碍的人。 SAP Challenge托管在Evaliai并利用远程评估管道上,根据单词错误率和语义分数评估提交。因此,在22个有效的团队中,有12个在WER方面表现优于窃窃私语-V2的基线,而17支球队在SEMScore上超过了基线。值得注意的是,顶级团队获得了8.11%的最低WER,同时达到了88.44%的最高SEMScore,为未来的ASR系统设定了新的基准,以识别语音受损。
- †伊利诺伊大学Urbana-Champaign University‡Microsoft§Amazon¶Google‡meta§cdli¶¶Inha University†††Kaist