OpenAI 于三个月前推出了文本转视频 Sora,引发了网友、媒体以及圈内人士的广泛讨论。Google 在今天召开的 2024 I/O 开发者大会上也推出了对标产品——Veo,其可以生成长度超过 1 分钟、分辨率最高 1080p 的“高质量”视频,并具有多种视觉和电影风格。

根据 Google 官方新闻稿,Veo 具备对自然语言有先进的理解能力,能够理解“延时摄影”、“航拍风景”等电影术语。

用户可以使用文本、图像或视频提示来指导他们所需的输出,Google 表示,这样产生的视频“更加连贯一致”,在整个镜头中人物、动物和物体的动作也更加逼真。

Google DeepMind 首席执行官德米斯·哈萨比斯(Demis Hassabis)在媒体预览会上表示,视频结果可以通过额外的提示进行完善,Google 正在探索更多功能,使 Veo 能够制作故事板和更长的场景。