Google DeepMind的Genie 3可能是虚拟世界的突破AI一直在等待

Google DeepMind只是在Genie 3上撤回了窗帘,这是一种实时的,逼真的“世界模型”,可以直接从文本提示中引起交互式环境。

来源:营销人工智能研究所
Google DeepMind只是在Genie 3上撤回了窗帘,这是一种实时的,逼真的“世界模型”,可以直接从文本提示中引起交互式环境。这不仅仅是另一个AI视频工具。 Genie 3可以以每秒24帧的形式呈现世界,一次保持视觉和物理一致性,并立即对导航和基于文本的输入做出响应。换句话说:您可以进入火山荒原,古老的雅典或茂密的雨林,并在探索它时观看世界的发展。尽管今天的发行是有限的研究预览,但DeepMind认为这是迈向人工通用智能(AGI)的主要一步。在161节中,人工智能展示和营销机构的新世界构成了新的企业,这是一个不断的创建,这是一个不断的创建范围,这是不可能的。在AI Playground在DeepMind自己的话语中,世界模型是AI系统,它们“利用他们对世界的理解来模拟它的各个方面”,可以预测环境将如何改变以及行动将如何改变它。因为它为AI代理提供了无限的训练场。他们可以通过无休止的逼真的模拟来掌握复杂的任务,而不是在昂贵或冒险的现实世界中学习。 这意味着新模型不仅仅是相当的视觉效果。实际上,它具有一些值得关注的最先进的功能。与Genie 3一起,您可以遍历它以稳定的24 fps生成的虚拟世界,场景立即对您的投入做出反应。它还具有长距离的一致性,因此它记得您只有一分钟的时间就看到了什么。 (即使重新审视即使景观和物体也保持一致。)在任何时候,您还可以通过促使不同的世界事件(例如改变天气或引入新的对象)来改变自己的Genie生成世界的条件。