详细内容或原文请订阅后点击阅览
KLING vs Sora:中国巨头快手推出视频生成模型
两分钟奇迹:KLING 做到了 OpenAI 都做不到的事情。
来源:安全实验室新闻频道两分钟奇迹:KLING 做到了 OpenAI 都做不到的事情。
中国科技公司快手推出了KLING,这是一种新的视频生成模型,从演示来看,它可以与OpenAI的Sora竞争。
克林快手表示,KLING 能够以 1080p 分辨率、每秒 30 帧的速度创建长达两分钟的视频。该模型还能够模拟看起来物理上合理的复杂运动。
作为 KLING 功能的示例,以下是为查询“窗外有不同景色的火车乘坐”而创建的两分钟火车乘坐视频。相比之下,OpenAI 在 2 月中旬推出了 Sora 视频生成模型,能够生成相对稳定的长达一分钟的视频。
另一个例子是一个男孩在花园里骑自行车的视频,周围的景观随着季节的变化而变化。尽管季节变化,骑自行车的男孩仍然出人意料地稳定,看起来相当可信。
视频:kling.kuaishou.com
据开发人员介绍,KLING 使用时空注意力系统来更好地模拟运动和物理交互。此外,由于其可扩展的架构和优化的输出,该模型能够生成长的高分辨率视频。
快手声称该模型正确模拟了现实世界的物理特性。例如,在其中一个视频中,一个男孩在一家快餐店吃芝士汉堡,第一口之后汉堡的大小就变小了。其他例子包括用刀切洋葱和一个人从盘子里吃意大利面,展示了物体之间的物理相互作用。
视频:kling.kuaishou.com
使用扩散变压器,KLING 还可以结合概念并创建虚构的场景,例如一只猫在繁忙的城市中驾驶汽车。