重新思考视频AI培训,并以用户为中心的数据
用户可能想要使用诸如Flux或Hunyuan视频之类的生成模型创建的内容类型,即使内容请求相当通用,也可能不容易获得可用的内容,并且可能会猜测生成器可以处理它。一个例子,在新论文中进行了说明,我们将[…]以用户为中心的数据重新思考视频AI培训,首先出现在Unite.ai上。
来源:Unite.AI用户可能想要使用诸如Flux或Hunyuan视频之类的生成模型创建的内容类型,即使内容请求相当通用,也可能不容易获得可用的内容,并且可能会猜测生成器可以处理它。
flux Hunyuan视频一个例子,在新论文中进行了说明,我们将在本文中查看,并指出,越来越多的Openai Sora模型在解剖上正确的萤火虫方面有一些困难,使用提示“萤火虫在宁静的夏季夜晚在草的叶子上发光”:
‘在宁静的夏日夜晚,萤火虫在草的叶子上发光''Openai的Sora对萤火虫解剖结构有一点奇怪的理解。资料来源:https://arxiv.org/pdf/2503.01739
Openai的Sora对萤火虫解剖结构有一点奇怪的理解。由于我很少以研究主张的形式提出研究主张,因此我今天在Sora上测试了同样的提示,并取得了更好的结果。但是,索拉仍然无法正确呈现光芒 - 而不是照亮萤火虫的尾巴,在发生生物发光的地方,它放错了昆虫脚附近的光芒:
我自己对Sora研究人员提示的测试产生的结果表明Sora不了解萤火虫的光实际来自哪里。
具有讽刺意味的是,Adobe Firefly生成的扩散引擎对公司的版权库存照片和视频进行了培训,在这方面,仅在Photoshop的Generative AI功能中尝试了相同的提示:
Adobe Firefly在研究人员提示的三代人中,只有在Adobe Firefly(2025年3月)中产生辉光,尽管至少闪闪发光位于昆虫解剖结构的正确部分。
作者状态:
他们引入了一个新策划的数据集,并建议在将来的工作中可以完善其方法,以创建比许多现有模型更好地与用户期望更好的数据收集。