机构名称:
¥ 2.0
这项工作报告了用于交互式视频游戏生成和模拟的视频生成模型的研究。我们讨论并探讨了可用预培训的开源视频生成模型的使用来创建可玩的交互式视频游戏。虽然能够生成各种描述的场景的简短剪辑,但此类模型仍然缺乏可控性和连续性。鉴于这些限制,我们专注于在单个游戏域上生产和演示可靠且可控的视频游戏生成器。我们介绍了Mariovgg,这是一种在超级马里奥兄弟游戏中可控视频生成的文本对视频扩散模型。mariovgg展示了能够持续产生一致且有意义的场景和水平的能力,并通过视频模拟可控播放器的物理和运动。