详细内容或原文请订阅后点击阅览

声音如何模拟世界

2022年11月14日 09:00 33 Comments

麻省理工学院的研究人员开发了一种机器学习技术，可以精确收集和模拟某个位置的底层声学，只需有限数量的声音记录即可。

来源:Qudata

麻省理工学院 (MIT) 和 MIT-IBM 沃森人工智能实验室的研究人员正在探索如何使用空间声学信息来帮助机器更好地表示其环境。科学家开发了一种机器学习模型，可以捕捉房间内任何声音在空间中的传播方式，从而使该模型能够模拟听众在不同位置听到的声音。

由于对场地声学的精确模拟，系统可以从录音中学习房间的基本 3D 几何形状。研究人员使用他们的系统收集的声学信息来创建房间的精确视觉表示，类似于人类在评估其物理环境属性时使用声音的方式。

除了在虚拟和增强现实中的所有潜在用途之外，这种方法还可以帮助 AI 代理更好地了解周围的世界。因此，根据描述该模型的文章的合著者、电气工程与计算机科学系 (EECS) 的研究生 Yilun Du 的说法：“通过对其环境中的声音的声学特性进行建模，水下探测机器人可以感知比仅凭视觉更远的事物”。

“到目前为止，大多数研究人员只专注于对视觉进行建模。但作为人类，我们有多模态感知。不仅视觉很重要，声音也很重要。我认为这项工作开辟了一个令人兴奋的研究方向，即更好地利用声音来模拟世界，”杜说。

了解有关如何使用声音模拟世界的更多信息，请访问 https://news.mit.edu/2022/sound-model-ai-1101

https://news.mit.edu/2022/sound-model-ai-1101

MIT 视觉表示声学模拟使用房间声音的研究人员 edu 环境 mit 信息进行 news 声音