详细内容或原文请订阅后点击阅览
对AccentFold的评论:关于非洲ASR的最重要论文之一
AccentFold解决了我们许多人可能与之相关的特定问题:当前的ASR系统对非洲元素的英语无法正常工作。这不是因为缺乏尝试。
来源:走向数据科学我喜欢阅读本文,不是因为我以前遇到过一些作者,而是因为这是必要的。到目前为止,我写过的大多数论文都在更广泛的ML社区中引起了轰动,这很棒。但是,这是非洲毫无疑问的(即它解决了一个非常非洲的问题),我认为每个非洲ML研究人员,尤其是对言语感兴趣的人都需要阅读它。
必要AccentFold解决了我们许多人可能与之相关的特定问题:当前的ASR系统对非洲元素的英语无法正常工作。这并不是因为缺乏尝试。
asr大多数现有方法都使用多任务学习,域适应或使用有限数据进行微调的技术,但是它们都撞到了同一墙:数据集中的非洲口音不足,并且为每个口音收集足够的数据是昂贵且不现实的。
以尼日利亚为例。我们有数百种本地语言,许多人长大后会说多一种。因此,当我们说英语时,口音是由我们的本地语言与它相互作用的方式来塑造的 - 通过发音,节奏甚至中间句子切换。在整个非洲,这只会变得更加复杂。
本文没有追逐更多数据,而是提供了更明智的解决方法:它引入了AccentFold,一种方法是从100多种非洲口音中学习重音嵌入的方法。这些嵌入捕获了深厚的语言关系(语音,句法,形态学),并帮助ASR系统概括为他们从未见过的口音。
AccentFold 嵌入仅这个想法就使本文成为如此重要的贡献。
相关工作
AccentFold以这个想法为基础,但将其进一步发展。最密切相关的工作还使用模型嵌入来支持重音ASR,但AccentFold以两种重要方式有所不同。