详细内容或原文请订阅后点击阅览
教人工智能像人类一样交流
受人类声道机制的启发,一种新的人工智能模型可以生成和理解日常声音的模仿。该方法有助于为娱乐和教育构建新的声音界面。
来源:MIT新闻 - 人工智能无论是描述汽车发动机故障的声音,还是模仿邻居家的猫叫,当语言无法传达概念时,用声音模仿声音是一种有用的传达概念的方式。
声音模仿相当于用涂鸦快速绘制图片来传达您看到的东西——只不过您不是用铅笔来描绘图像,而是用声道来表达声音。这似乎很难,但这是我们所有人都能直观做到的事情:要亲自体验,请尝试用您的声音模仿救护车警报器、乌鸦或敲钟的声音。
受我们如何交流的认知科学的启发,麻省理工学院计算机科学与人工智能实验室 (CSAIL) 的研究人员开发了一种人工智能系统,该系统无需经过训练,甚至从未“听过”人类的声音印象,就可以产生类似人类的声音模仿。
为了实现这一目标,研究人员设计了他们的系统,使其能够像我们一样产生和解释声音。他们首先建立了一个人类声道模型,模拟喉咙、舌头和嘴唇如何形成声带振动。然后,他们使用一种受认知启发的人工智能算法来控制这个声道模型,并使其产生模仿,同时考虑到人类选择传达声音的特定语境方式。
该模型可以有效地从世界上获取许多声音并产生类似人类的模仿——包括树叶沙沙作响、蛇的嘶嘶声和接近的救护车警报声等噪音。他们的模型也可以反向运行,从人类的声音模仿中猜测真实世界的声音,类似于一些计算机视觉系统可以根据草图检索高质量图像的方式。例如,该模型可以正确区分人类模仿猫的“喵喵”和“嘶嘶”的声音。
-模仿的艺术,分为三个部分
模仿的艺术,分为三个部分迈向更具表现力的声音技术