音调重音检测改善了预验证的自动语音识别 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

音调重音检测改善了预验证的自动语音识别

2025年8月15日 00:00 33 Comments

我们通过引入关节ASR和音高强调检测模型来提高使用半监督语音表示的自动语音识别（ASR）系统的性能。我们模型的音高重音检测部分可以在最新的任务上取得显着改善，从而使F1得分的差距缩小了41％。此外，在有限的资源微调下，联合培训中的ASR性能在Librispeech上降低了28.3％。通过这些结果，我们表明了延长预估计的重要性…

来源:Apple机器学习研究

韵律关节提高重要的音高系统的音调使用模型的语音重新学习线索检测有限的 ASR 联合模型性能最新的重要性验证的语音识别

音调重音检测改善了预验证的自动语音识别

其他外部链接

Tags

XiaoMi-AI