这项草根性努力如何让人工智能的声音更加多样化 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

这项草根性努力如何让人工智能的声音更加多样化

2024年11月15日 10:24 33 Comments

我们正处于语音 AI 热潮的风口浪尖，Apple 和 OpenAI 等科技公司正在推出下一代人工智能助手。但这些助手的默认声音通常是白人美国人（如果你幸运的话，可能是英国人）而且大多数肯定会说英语。他们只代表了众多方言中的一小部分……

来源:MIT Technology Review _人工智能

Ryakitimbo 收集了坦桑尼亚、肯尼亚和刚果民主共和国的斯瓦希里语语音数据。她告诉我，她想收集来自社会经济背景各异的斯瓦希里语使用者的声音，并联系了生活在农村地区的妇女，她们可能不识字，甚至无法使用设备。

这种数据收集具有挑战性。收集人工智能语音数据的重要性对许多人来说可能很抽象，尤其是如果他们不熟悉这些技术的话。 Ryakitimbo 和志愿者会在女性感到安全的环境中接触她们，例如在关于月经卫生的演讲中，解释这项技术如何帮助传播有关月经的信息。对于不识字的女性，团队会读出她们会在录音中重复的句子。

Common Voice 项目基于这样的信念：语言是身份的重要组成部分。 “我们认为这不仅关乎语言，还关乎传承文化和传统，珍视人们独特的文化背景，”Lewis-Jong 说道。“有各种各样的习语和文化流行语就是无法翻译，”他们补充道。

卡内基梅隆大学研究音频数据集的研究员 Willie Agnew 表示，Common Voice 是唯一一个不以英语为主的音频数据集。“我对他们做得如此出色以及他们制作这个实际上非常多样化的数据集的能力印象深刻，”Agnew 说道。“感觉他们远远领先于我们研究的几乎所有其他项目。”

我花了一些时间在 Common Voice 平台上验证其他芬兰语使用者的录音。当他们的声音在我的书房中回响时，我感到意外地感动。我们都聚集在一起是为了同一个目标：让人工智能数据更具包容性，并确保我们的文化和语言在下一代人工智能工具中得到适当的体现。

给予人们适当的信任，土著群体

数据集适当的 Common 语音斯瓦希里关乎收集文化下一代人工智能实际上语言包容性多样化数据收集 Agnew 女性意外地音频数据所有其他感到人们研究员 Voice Ryakitimbo 数据使用者重要性