详细内容或原文请订阅后点击阅览
诺基亚手机用户请订阅
研究人员面临的主要障碍之一是缺乏公开数据。
来源:OSP网站大数据新闻来源:使用 Kandinsky 神经网络/fusionbrain.ai 创建
您有没有想过了解您的狗想说什么?密歇根大学的研究人员正在利用人工智能开发工具来确定狗的叫声是否表达了嬉戏或攻击性。相同的模型能够从动物声音中提取其他信息,例如年龄、品种和性别。它们可以成为训练旨在与动物交流的新系统的起点。研究人员利用最初针对人类语音进行训练的语音处理模型,在理解狗叫声方面取得了进展。
开发能够分析动物语音的人工智能模型的主要障碍之一是缺乏公开数据。声音应在野外被动记录,对于家养动物,应征得其主人的许可。由于缺乏数据,其分析技术的开发很复杂,而且现有的技术也因缺乏培训材料而受到限制。然而,研究人员能够通过重新利用最初为分析人类语音而开发的现有模型来克服这些困难。这些模型经过训练可以识别人类语音的细微差别,例如音色、音调和口音,并将它们转换为计算机可以用来确定口语单词、识别说话者身份等的格式。