教人工智能像人类一样交流 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

教人工智能像人类一样交流

2025年1月9日 00:00 33 Comments

受人类声道机制的启发，一种新的人工智能模型可以生成和理解日常声音的模仿。该方法有助于为娱乐和教育构建新的声音界面。

来源:MIT新闻 - 人工智能

无论是描述汽车发动机故障的声音，还是模仿邻居家的猫叫，当语言无法传达概念时，用声音模仿声音是一种有用的传达概念的方式。

声音模仿相当于用涂鸦快速绘制图片来传达您看到的东西——只不过您不是用铅笔来描绘图像，而是用声道来表达声音。这似乎很难，但这是我们所有人都能直观做到的事情：要亲自体验，请尝试用您的声音模仿救护车警报器、乌鸦或敲钟的声音。

受我们如何交流的认知科学的启发，麻省理工学院计算机科学与人工智能实验室 (CSAIL) 的研究人员开发了一种人工智能系统，该系统无需经过训练，甚至从未“听过”人类的声音印象，就可以产生类似人类的声音模仿。

为了实现这一目标，研究人员设计了他们的系统，使其能够像我们一样产生和解释声音。他们首先建立了一个人类声道模型，模拟喉咙、舌头和嘴唇如何形成声带振动。然后，他们使用一种受认知启发的人工智能算法来控制这个声道模型，并使其产生模仿，同时考虑到人类选择传达声音的特定语境方式。

该模型可以有效地从世界上获取许多声音并产生类似人类的模仿——包括树叶沙沙作响、蛇的嘶嘶声和接近的救护车警报声等噪音。他们的模型也可以反向运行，从人类的声音模仿中猜测真实世界的声音，类似于一些计算机视觉系统可以根据草图检索高质量图像的方式。例如，该模型可以正确区分人类模仿猫的“喵喵”和“嘶嘶”的声音。

模仿的艺术，分为三个部分

模仿的艺术，分为三个部分

迈向更具表现力的声音技术

发动机产生人工智能相当于系统人类警报器计算机声道声音认知科学考虑到救护车方式视觉系统传达模型研究人员实验室模仿

教人工智能像人类一样交流

其他外部链接

Tags

XiaoMi-AI