Tencent的新AI创建了一个完整的3D世界，只有一个句子或图片 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

Tencent的新AI创建了一个完整的3D世界，只有一个句子或图片

2025年7月28日 04:25 33 Comments

Tencent最近发布了其3D World Creation的AI模型为开源代码，称为Hunyuan3D World 1.0。该模型旨在直接从图像或文本描述中生成交互式3D世界。该工具解决了游戏开发人员和VR创建者多年来一直在努力的问题。以前，有两种主要方法[…]来自Tencent的纽约AI，创建了一个完整的3D Worlds，它仅从一个句子或一个图像中首次出现在AI新闻上。

来源:AI新闻

Hunyuanworld-1.0-第一个基于开源的模型，该模型仅从文本或图像中生成完整的，可延展的3D世界360°。全景图像用作360°世界代理，用于语义意识的划分和场景重建。

HunyuanWorld-1.0-第一个基于开源的模型，该模型仅从文本或图像中产生完整的，可渗透的3D世界360°。

全景图像用作360°世界代理，用于语义意识的划分和场景重建。

该框架是开源编码并基于通量的，有可能适应其他图像生成模型。

Tencent最近发布了其3D World Creation的AI模型为开源代码，称为Hunyuan3D World 1.0。该模型旨在直接从图像或文本描述中生成交互式3D世界。

Hunyuan3D世界模型1.0

该工具解决了游戏开发人员和VR创建者多年来一直在努力的问题。以前，有两种主要的方法来创建3D世界：缺乏实际3D深度的基于视频的方法或需要大量数据和内存的基于3D的方法。

魔术在幕后如何工作？

当您理解时，该过程实际上非常优雅。 Hunyuanworld并没有试图直接创建一个3D世界，而是在多个步骤中使用明智的策略：

首先，它创建了一个全景图像，该图像从文本或图像中覆盖了整个360度视图。然后，智能AI系统分析了该全景，并将其分为不同的层，背景，前景和物体。最后，每层都通过深度图和纹理转换为真实的3D几何形状。

如何开始

https://github.com/tencent-hunyuan/hunyuanworld-1.0

系统要求：您需要Python 3.10，Pytorch 2.5.0，最好是带有CUDA支持的NVIDIA图形卡。

系统要求：

图像几何形状交互式实际上 1.0 不同的全景图模型真实的文本意识可延展的全景图像 360 3D 主要的 Hunyuanworld 系统分析系统要求可渗透的开发人员开源代理方法语义世界完整的源代码用于图像生成背景渗透的支持的