谷歌发布Veo 3.1：AI视频生成迈入原生音频时代

时间：2025-10-16 11:08:40　来源：网易科技报道　作者：网易科技报道

10月16日消息，谷歌于昨晚深夜正式推出其最新一代AI视频生成模型——Veo 3.1。作为继OpenAI Sora之后的又一重量级产品，Veo 3.1在技术层面实现了关键突破，标志着AI生成内容从“纯视觉”向“视听融合”的全面升级。

原生音频能力：AI视频的“声画合一”革命

Veo 3.1的核心创新在于原生音频生成功能。用户通过“以图生视频”（Ingredients to Video）、“连帧成片”（Frames to Video）及“延展”（Extend）三大核心模式生成视频时，系统可同步生成包含环境音效、人物对白及背景音乐的完整音频。这一技术突破使AI视频从“无声画面”跃升为具备沉浸式叙事能力的“视听作品”，例如用户可生成一段雨林探险视频，并自动匹配鸟鸣、雨声及探险者的对话。

Flow工具升级：精准控制与长视频生成

伴随Veo 3.1的发布，谷歌同步更新了其AI电影创作工具Flow。新版Flow支持用户以更高精度编辑场景、衔接镜头，并实现视频的“颗粒化控制”。技术层面，Veo 3.1的视频生成时长从上一代的8秒扩展至30秒甚至1分钟以上，且通过智能过渡算法确保长片段的连贯性。例如，用户可生成一段3分钟的微电影，包含多个场景切换与自然音效过渡。

商业化进展：面向Gemini API付费用户开放

目前，Veo 3.1处于预览阶段，仅对Gemini API付费用户开放。其收费标准与上一代保持一致：标准模型（Standard）按每秒0.40美元计费，快速模型（Fast）按每秒0.15美元计费。这一策略既保障了技术迭代成本，也为专业创作者提供了灵活的选择空间。

行业影响：AI视频生成竞争进入新阶段

随着Veo 3.1的发布，AI视频生成领域的竞争进一步加剧。相较于Sora，Veo 3.1在音频生成与长视频支持上展现出差异化优势，而Flow工具的升级则强化了谷歌在专业创作场景中的竞争力。未来，随着技术的持续优化，AI生成内容有望在影视制作、广告营销等领域引发更深远的变革。

本文来自网易科技报道，更多资讯和深度内容，请持续关注。

上一篇：阿里AI战略解析：夸克应用为何难敌豆包？
下一篇：返回列表

猜你喜欢