详细内容或原文请订阅后点击阅览
立方体梦想
使用矢量量化变分自动编码器 (VQ-VAE) 和 Transformers 生成 Minecraft 世界《立方体梦想》一文首先出现在《走向数据科学》上。
来源:走向数据科学这对我(以及许多其他人)来说很珍贵,因为它在某种程度上见证了我从小学生的成长,一直到(即将成为!) 大学毕业生。游戏魅力不可否认的一部分是其源自世界生成的无限重玩性。在游戏的当前版本中,《我的世界》结合使用各种噪声函数,以程序性方式生成[1]块形式的世界,即块,以一种(或多或少)倾向于形成“自然”外观地形的方式,为游戏提供了很大的沉浸感。
我这个项目的目标是看看我是否可以超越硬编码的噪声,而是教模型在体素中“做梦”。通过利用矢量量化变分自编码器 (VQ-VAE) 和 Transformer 的最新发展,我构建了一个管道来生成 3D 世界切片,以捕捉游戏景观的结构本质。作为具体的输出,我希望能够生成看起来像 Minecraft 地形的块(排列在网格中)。
顺便说一句,这并不是一个全新的想法,即 ChunkGAN [2] 提供了另一种方法来解决同一目标。
3D 生成建模的挑战
为了克服 Stuart 提到的 3D 数据稀缺问题,我转向了 Minecraft,在我看来,它是可用于地形生成的体素数据的最佳来源。通过使用脚本在预先生成的世界中传送,我迫使游戏引擎加载并渲染数千个独特的块。使用单独的提取脚本,我直接从游戏的区域文件中提取这些块。这给了我一个具有高度语义一致性的数据集;与随机 3D 对象的集合不同,这些块代表了连续、流动的景观,其中地形的“逻辑”(河床如何倾斜或山峰如何)在块边界上得以保留。
数据预处理
架构概述
这个美人鱼序列图 [6] 提供了架构的鸟瞰图。
