KLING vs Sora:中国巨头快手推出视频生成模型

两分钟奇迹:KLING 做到了 OpenAI 都做不到的事情。

来源:安全实验室新闻频道

两分钟奇迹:KLING 做到了 OpenAI 都做不到的事情。

中国科技公司快手推出了KLING,这是一种新的视频生成模型,从演示来看,它可以与OpenAI的Sora竞争。

克林

快手表示,KLING 能够以 1080p 分辨率、每秒 30 帧的速度创建长达两分钟的视频。该模型还能够模拟看起来物理上合理的复杂运动。

作为 KLING 功能的示例,以下是为查询“窗外有不同景色的火车乘坐”而创建的两分钟火车乘坐视频。相比之下,OpenAI 在 2 月中旬推出了 Sora 视频生成模型,能够生成相对稳定的长达一分钟的视频。

另一个例子是一个男孩在花园里骑自行车的视频,周围的景观随着季节的变化而变化。尽管季节变化,骑自行车的男孩仍然出人意料地稳定,看起来相当可信。

视频:kling.kuaishou.com

据开发人员介绍,KLING 使用时空注意力系统来更好地模拟运动和物理交互。此外,由于其可扩展的架构和优化的输出,该模型能够生成长的高分辨率视频。

快手声称该模型正确模拟了现实世界的物理特性。例如,在其中一个视频中,一个男孩在一家快餐店吃芝士汉堡,第一口之后汉堡的大小就变小了。其他例子包括用刀切洋葱和一个人从盘子里吃意大利面,展示了物体之间的物理相互作用。

视频:kling.kuaishou.com

使用扩散变压器,KLING 还可以结合概念并创建虚构的场景,例如一只猫在繁忙的城市中驾驶汽车。