媒体播放器关键词检索结果

语音主张的歧视性撤销语音搜索错误校正

Phonetically-Augmented Discriminative Rescoring for Voice Search Error Correction

端到端(E2E)自动语音识别(ASR)模型是使用配对的音频文本样本训练的,这些样品的获取昂贵,因为高质量的地面图数据需要人体注释。语音搜索应用程序(例如数字媒体播放器)利用ASR允许用户通过语音搜索而不是屏幕键盘。但是,在E2E ASR系统的训练数据中可能没有足够的代表或不足的电影标题,因此可能会受到较差的认可。在本文中,我们提出了一个语音校正系统,该系统由(a)基于…