详细内容或原文请订阅后点击阅览
Tencent的新AI创建了一个完整的3D世界,只有一个句子或图片
Tencent最近发布了其3D World Creation的AI模型为开源代码,称为Hunyuan3D World 1.0。该模型旨在直接从图像或文本描述中生成交互式3D世界。该工具解决了游戏开发人员和VR创建者多年来一直在努力的问题。以前,有两种主要方法[…]来自Tencent的纽约AI,创建了一个完整的3D Worlds,它仅从一个句子或一个图像中首次出现在AI新闻上。
来源:AI新闻- Hunyuanworld-1.0-第一个基于开源的模型,该模型仅从文本或图像中生成完整的,可延展的3D世界360°。全景图像用作360°世界代理,用于语义意识的划分和场景重建。
Tencent最近发布了其3D World Creation的AI模型为开源代码,称为Hunyuan3D World 1.0。该模型旨在直接从图像或文本描述中生成交互式3D世界。
Hunyuan3D世界模型1.0该工具解决了游戏开发人员和VR创建者多年来一直在努力的问题。以前,有两种主要的方法来创建3D世界:缺乏实际3D深度的基于视频的方法或需要大量数据和内存的基于3D的方法。
魔术在幕后如何工作?
当您理解时,该过程实际上非常优雅。 Hunyuanworld并没有试图直接创建一个3D世界,而是在多个步骤中使用明智的策略:
首先,它创建了一个全景图像,该图像从文本或图像中覆盖了整个360度视图。然后,智能AI系统分析了该全景,并将其分为不同的层,背景,前景和物体。最后,每层都通过深度图和纹理转换为真实的3D几何形状。
如何开始
https://github.com/tencent-hunyuan/hunyuanworld-1.0系统要求:您需要Python 3.10,Pytorch 2.5.0,最好是带有CUDA支持的NVIDIA图形卡。
系统要求: