最近谷歌为所有用户推出对其高分辨率文本转视频生成器 Veo 2 的访问。
Veo 2 可通过网络和移动设备上 Gemini 应用程序中的下拉菜单访问,允许用户将书面提示转换为 720p 分辨率的 8 秒短视频。谷歌表示,该模型旨在创建更流畅的角色移动、逼真的环境和更好的场景构图,所有这些都在其所谓的“电影现实主义”的保护伞下进行。虽然这些说法表明它是从静态图像生成演变而来的,但该工具在不同提示类型中如何一致地满足这些期望还有待观察。
每个用户都会获得每月的视频配额,并在接近限制时收到提醒。视频以 16:9 的纵横比交付,移动用户可以下载或直接将其推送到TikTok 的或优酷具有 MP4 格式的内置分享功能,使 Veo 2 对创作者和社交媒体营销人员特别有用。
除了 Veo 2,谷歌还推出了 Whisk Animate,这是一种将单个图像转换为 Gemini Advanced 用户的 8 秒视频的工具。这一新增功能是该公司在 Google Labs 内进行更广泛实验的一部分,可供 AI Premium 订阅者使用。该功能建立在原始的 Whisk 图像工具之上,这表明 Gemini 下的视觉内容工具生态系统正在不断壮大。
谷歌在 AI 视频领域并不孤单。竞争对手喜欢OpenAI 的 Sora正在通过更长的一分钟视频突破界限。虽然 Sora 追求长度,但 Google 在较短的剪辑中优先考虑视觉细节和动作真实感。这是一种质量与数量的游戏,根据用例的不同,其吸引力可能会有所不同。另一家竞争对手 Runway 刚刚发布了第四代视频生成器,并筹集了超过 3 亿美元的新资金,这表明竞争环境更加激烈。
谷歌显然将 Gemini 不仅定位为聊天机器人,而且定位为创意强国。随着 SynthID 水印融入到 Veo 2 的每个输出中,该公司还试图表明遵守关于透明度和数字内容道德的更广泛对话。
Veo 2 的更广泛影响将取决于它在 Google 控制的演示之外的表现,以及用户如何有效地将其集成到现实世界的创意工作流程中。目前,它的推出标志着 AI 生成领域不断发展的又进一步。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“早讯网”用户上传并发布,本平台仅提供信息存储服务。
本站所有图片由云图床提供储存服务。
发表评论 取消回复