谷歌最新视频生成模型 Veo 3.1 来了!今日上手可用。
北京时间 10 月 16 日,谷歌在 Gemini API 中发布了 Veo 3.1 和 Veo 3.1 Fast 付费预览版。模型一上线,就受到了行业的高度关注。毕竟,和前不久发布的 Sora 2 一样,这次 Veo 3.1 也新增了音频功能。
相较于上一代 Veo 3 来说,Veo 3.1 此次提升主要聚焦在三大方面:
第一,是 AI 生成视频从默片走向有声电影。Veo 3.1 不但能够要求 AI 视频实现声音画面统一,还能够要求 AI 更好地理解画面内容,并给予合适的配乐。
第二,Veo 3.1 可以直接设定 AI 视频的开篇画面和结尾画面。如此一来,Veo 3.1 不但能够实现短视频和短视频之间的过渡自然,也能够进一步控制 AI 视频的首尾观感。甚至,Veo 3.1 可以实现每一个新的视频都是基于上一个视频的最后一个画面继续生成。在无限叠加的 Buff 下,谷歌用一种另类的方式实现了「AI 长视频」生成。
比如说,当你告诉 Veo 3.1,以下两张图片是 AI 视频的开篇画面和结尾画面:
第三,Veo 3.1 可以通过三张图打造一个人设。
当你给 Veo 3.1 三张图片,分别为一个女性头像、一个服装参考图以及一个场景设定时,根据提示词要求,Veo 3.1 可以直接通过三张画面设定 AI 人物形象,并且可以让该人物自然地说出目标台词。
此次,Veo 3.1 主打进一步优化 AI 视频在视听观感上的体验。同时,谷歌也是在 AI 视频生成片段时间较短的前提下,寻找能够实现「AI 长视频叙事」的解法。
栏目作者召集
极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!
现在,我们也向所有喜欢尝鲜和体验 AI 的同学发出召集,只要你发现并体验了新的 AI 应用或者功能,按照格式(参考案例:)向栏目投稿,在极客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订阅费用。
同时,优秀作者还有机会进入极客公园 AI 体验群,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。
AGI 太久,只争朝夕,让一部分人先 AI 起来吧!投稿、进群请扫描下方二维码添加极客小助手微信