AI工具比最先进的方法更快地生成高质量的图像

研究人员融合了两种流行方法中最好的方法,以创建一个使用较少能量的图像生成器,并且可以在笔记本电脑或智能手机上本地运行。

来源:MIT新闻 - 人工智能

快速生成高质量图像的能力对于生产可用于训练自动驾驶汽车以避免不可预测的危害的逼真的模拟环境至关重要,从而使它们在真实的街道上更安全。

但是,生成的人工智能技术越来越多地用于产生此类图像。一种流行的模型类型,称为扩散模型,可以创建惊人的逼真的图像,但对于许多应用程序而言,它太慢且计算密集型。另一方面,像ChatGpt这样的PASIC LLM的自回旋模型要快得多,但是它们会产生质量较差的图像,这些图像通常会带有错误。

MIT和NVIDIA的研究人员开发了一种新方法,将这两种方法的最佳结合在一起。他们的混合图像生成工具使用自回旋模型快速捕获大图,然后是一个小的扩散模型来完善图像的细节。

他们的工具,称为HART(杂交自动回旋变压器的简称),可以生成匹配或超过最先进扩散模型质量的图像,但要快的速度更快。

生成过程比典型的扩散模型所消耗的计算资源少,使Hart可以在商业笔记本电脑或智能手机上本地运行。用户只需要在HART接口中输入一个自然语言提示即可生成图像。

hart可能具有广泛的应用程序,例如帮助研究人员培训机器人完成复杂的现实世界任务,并帮助设计师为视频游戏制作出惊人的场景。

“如果您要画一个景观,而您只画一次整个帆布,它看起来可能不是很好。但是,如果您绘制大图,然后用较小的笔触来完善图像,您的画作看起来会更好。这是Hart的基本思想。

Hart上的新论文

两全其美

优于较大模型