扫描打开手机站
随时逛,更方便!
当前位置:首页 > 智创未来

谷歌发布Veo 3.1:AI视频生成迈入原生音频时代

时间:2025-10-16 11:08:40 来源:网易科技报道 作者:网易科技报道

10月16日消息,谷歌于昨晚深夜正式推出其最新一代AI视频生成模型——Veo 3.1。作为继OpenAI Sora之后的又一重量级产品,Veo 3.1在技术层面实现了关键突破,标志着AI生成内容从“纯视觉”向“视听融合”的全面升级。

原生音频能力:AI视频的“声画合一”革命

Veo 3.1的核心创新在于原生音频生成功能。用户通过“以图生视频”(Ingredients to Video)、“连帧成片”(Frames to Video)及“延展”(Extend)三大核心模式生成视频时,系统可同步生成包含环境音效、人物对白及背景音乐的完整音频。这一技术突破使AI视频从“无声画面”跃升为具备沉浸式叙事能力的“视听作品”,例如用户可生成一段雨林探险视频,并自动匹配鸟鸣、雨声及探险者的对话。

Flow工具升级:精准控制与长视频生成

伴随Veo 3.1的发布,谷歌同步更新了其AI电影创作工具Flow。新版Flow支持用户以更高精度编辑场景、衔接镜头,并实现视频的“颗粒化控制”。技术层面,Veo 3.1的视频生成时长从上一代的8秒扩展至30秒甚至1分钟以上,且通过智能过渡算法确保长片段的连贯性。例如,用户可生成一段3分钟的微电影,包含多个场景切换与自然音效过渡。

商业化进展:面向Gemini API付费用户开放

目前,Veo 3.1处于预览阶段,仅对Gemini API付费用户开放。其收费标准与上一代保持一致:标准模型(Standard)按每秒0.40美元计费,快速模型(Fast)按每秒0.15美元计费。这一策略既保障了技术迭代成本,也为专业创作者提供了灵活的选择空间。

行业影响:AI视频生成竞争进入新阶段

随着Veo 3.1的发布,AI视频生成领域的竞争进一步加剧。相较于Sora,Veo 3.1在音频生成与长视频支持上展现出差异化优势,而Flow工具的升级则强化了谷歌在专业创作场景中的竞争力。未来,随着技术的持续优化,AI生成内容有望在影视制作、广告营销等领域引发更深远的变革。

本文来自网易科技报道,更多资讯和深度内容,请持续关注。