语音识别关键词检索结果

利用视听数据来减少自我监管的语音模型中的多语言差距

Leveraging Audio-Visual Data to Reduce the Multilingual Gap in Self-Supervised Speech Models

自学学习(SSL)在语音表示学习方面取得了重大进步。 WAV2VEC 2.0和Hubert等模型已经实现了最先进的结果,诸如语音识别之类的任务,尤其是在单语言环境中。但是,多语言SSL模型倾向于在每种语言上表现不佳,尤其是在具有双语设置等语言的多语言场景中。在这项工作中,我们通过将有限的视觉接地引入双语语音SSL模型来研究一种新的方法来减少这种性能差距。我们的…

苹果自然语言和交互式系统的研讨会2025

Apple Workshop on Natural Language and Interactive Systems 2025

自然语言处理(NLP)仍然是AI中最快发展的领域之一,因为新的研究继续迅速推进大型语言模型(LLMS),语音识别和发电的系统,语言代理等。这项技术对于当今的许多AI体验至关重要,包括Apple Intelligence和Siri,NLP的基础研究将是对未来AI的基础。Apple最近主持了关于自然语言和互动系统的研讨会,将Apple和学术研究社区的成员聚集在两天的活动中,重点是最近……