重新思考视频AI培训,并以用户为中心的数据

用户可能想要使用诸如Flux或Hunyuan视频之类的生成模型创建的内容类型,即使内容请求相当通用,也可能不容易获得可用的内容,并且可能会猜测生成器可以处理它。一个例子,在新论文中进行了说明,我们将[…]以用户为中心的数据重新思考视频AI培训,首先出现在Unite.ai上。

来源:Unite.AI

用户可能想要使用诸如Flux或Hunyuan视频之类的生成模型创建的内容类型,即使内容请求相当通用,也可能不容易获得可用的内容,并且可能会猜测生成器可以处理它。

flux Hunyuan视频

一个例子,在新论文中进行了说明,我们将在本文中查看,并指出,越来越多的Openai Sora模型在解剖上正确的萤火虫方面有一些困难,使用提示“萤火虫在宁静的夏季夜晚在草的叶子上发光”:

‘在宁静的夏日夜晚,萤火虫在草的叶子上发光''

Openai的Sora对萤火虫解剖结构有一点奇怪的理解。资料来源:https://arxiv.org/pdf/2503.01739

Openai的Sora对萤火虫解剖结构有一点奇怪的理解。

由于我很少以研究主张的形式提出研究主张,因此我今天在Sora上测试了同样的提示,并取得了更好的结果。但是,索拉仍然无法正确呈现光芒 - 而不是照亮萤火虫的尾巴,在发生生物发光的地方,它放错了昆虫脚附近的光芒:

我自己对Sora研究人员提示的测试产生的结果表明Sora不了解萤火虫的光实际来自哪里。

具有讽刺意味的是,Adobe Firefly生成的扩散引擎对公司的版权库存照片和视频进行了培训,在这方面,仅在Photoshop的Generative AI功能中尝试了相同的提示:

Adob​​e Firefly

在研究人员提示的三代人中,只有在Adobe Firefly(2025年3月)中产生辉光,尽管至少闪闪发光位于昆虫解剖结构的正确部分。

作者状态:

他们引入了一个新策划的数据集,并建议在将来的工作中可以完善其方法,以创建比许多现有模型更好地与用户期望更好的数据收集。

人物的数据

Lora 大量收藏 laion videoufo 新作品