字符集关键词检索结果

优化端到端 ASR 的字节级表示

Optimizing Byte-level Representation for End-to-End ASR

在本文中,我们提出了一种优化端到端 (E2E) 自动语音识别 (ASR) 字节级表示的算法。当支持的语言的字符集很大时,大型多语言 ASR 系统通常会使用字节级表示。字节级表示的紧凑性和通用性使 ASR 模型可以使用较小的输出,从而提供更大的灵活性。UTF-8 是最常用的字节级表示,已成功应用于 ASR。然而,它不是为 ASR 或任何机器学习任务设计的。通过使用……