使用 RAG 使用 Amazon Bedrock 和 Amazon Nova Reel 生成视频

在这篇文章中,我们探索通过 VRAG 生成视频的方法,将自然语言文本提示和图像转换为接地气的高质量视频。通过这个完全自动化的解决方案,您可以从结构化文本和图像输入生成逼真的、人工智能驱动的视频序列,从而简化视频创建过程。

来源:亚马逊云科技 _机器学习

生成高质量的自定义视频仍然是一个重大挑战,因为视频生成模型仅限于其预先训练的知识。这种限制影响了广告、媒体制作、教育和游戏等行业,在这些行业中,视频生成的定制和控制至关重要。

为了解决这个问题,我们开发了视频检索增强生成 (VRAG) 多模式管道,该管道使用图像库作为参考将结构化文本转换为定制视频。该解决方案使用 Amazon Bedrock、Amazon Nova Reel、Amazon OpenSearch Service 矢量引擎和 Amazon Simple Storage Service (Amazon S3),将图像检索、基于提示的视频生成和批处理无缝集成到单个自动化工作流程中。用户提供感兴趣的对象,解决方案从索引数据集中检索最相关的图像。然后,他们定义一个操作提示(例如,“相机顺时针旋转”),该提示与检索到的图像组合以生成视频。文本文件的结构化提示允许在一次执行中生成多个视频,为人工智能辅助媒体生成创建可扩展、可重用的基础。

在这篇文章中,我们探索通过 VRAG 生成视频的方法,将自然语言文本提示和图像转换为接地气的高质量视频。通过这个完全自动化的解决方案,您可以从结构化文本和图像输入生成逼真的、人工智能驱动的视频序列,从而简化视频创建过程。

解决方案概述

我们的解决方案旨在采用结构化文本提示、检索最相关的图像,并使用 Amazon Nova Reel 生成视频。该解决方案将多个组件集成到无缝工作流程中:

  • 基于提示的视频生成 – 用户定义操作提示(例如,“相机平移”),该提示与检索到的图像相结合,使用 Amazon Nova Reel 生成视频。
  • – 动态替换为查询的对象。