Google的生成视频模型VEO 3具有字幕问题

Google在5月底启动了最新的视频AI模型后,Creatives急于通过其步伐进行。 WEO 3在其前身后仅几个月发布,允许用户首次产生声音和对话,引发一连串的超现实主义八秒钟剪辑,将其缝合在一起成广告,ASMR视频,…

来源:MIT Technology Review _人工智能

摆脱它们并不简单,也不是便宜的。用户被迫使用外部字幕移动工具或裁剪他们的视频以完全摆脱字幕的剪辑(这花费更多的钱)(这花费了更多的钱)(花费更多的钱)。

Google Labs和Gemini副总裁Josh Woodward于6月9日在X上发布了Google开发的修复程序以减少Gibberish文本。但是一个月后,用户仍在Google Labs的Discord频道中记录其问题,这表明在主要AI模型中纠正问题的困难是多么困难。

发布 still 记录 问题 与它 Discord频道

与其前任一样,VEO 3可以向Google订阅层的成员支付,该级别的起价为每月249.99美元。为了生成八秒钟的剪辑,用户输入了文本提示,描述了他们想在Google的AI电影制作工具流,Gemini或其他Google平台中创建的场景。每个VEO 3一代至少要花费20个AI积分,并且该帐户可以以每2,500个积分的价格为25美元。

广告创意总监 Mona Weiss说,为了摆脱随机字幕而重生的场景变得越来越昂贵。她说:“如果您正在通过对话创建场景,则多达40%的输出具有gibberish字幕,使其无法使用。” “您正在通过金钱燃烧,试图获得自己喜欢的场景,但您甚至无法使用它。” Weiss通过其Discord渠道向Google Labs报告了该问题,以期希望为她的浪费信用退款,其团队将她指向了公司的官方支持团队。他们向她提供了VEO 3的费用,但没有为此获得信用。魏斯拒绝了,因为接受将意味着完全失去对模型的访问。 Google Labs的Discord支持团队一直在告诉用户,可以通过语音触发字幕,说他们知道问题并正在努力解决问题。

Mona Weiss说,为了摆脱随机字幕而重生的场景变得越来越昂贵。她说:“如果您正在通过对话创建场景,则多达40%的输出具有gibberish字幕,使其无法使用。” “您正在通过金钱燃烧,试图获得自己喜欢的场景,但您甚至无法使用它。”Weiss通过其Discord渠道向Google Labs报告了该问题,以期希望为她的浪费信用退款,其团队将她指向了公司的官方支持团队。他们向她提供了VEO 3的费用,但没有为此获得信用。魏斯拒绝了,因为接受将意味着完全失去对模型的访问。 Google Labs的Discord支持团队一直在告诉用户,可以通过语音触发字幕,说他们知道问题并正在努力解决问题。