2024年9月24日,在杭州举办的2025云栖大会上,阿里巴巴集团正式发布其最新AI创作工具——通义万相Wan2.5preview系列模型。该系列涵盖文生视频、图生视频、文生图和图像编辑四大核心功能模块,标志着AI视频创作领域迈入全新阶段。
其中最受瞩目的通义万相2.5视频生成模型,通过创新性的多模态算法,实现了视频画面与音频的深度融合。该模型可自动生成与画面内容精准匹配的人声旁白、环境音效及背景音乐(BGM),首次在消费级AI工具中达成完整的音画同步能力。这一突破性进展将电影级视频创作的专业门槛大幅降低,使普通用户也能轻松产出具有专业质感的视频内容。
据发布会现场演示,用户仅需输入文本描述或上传基础图片,系统即可在数分钟内生成包含完整音轨的高质量视频。生成的素材不仅画面流畅自然,其配套的语音、音效和配乐更能与视觉内容形成完美呼应,极大提升了创作效率与作品表现力。
即日起,用户可通过两种方式体验这项革命性技术:在阿里云百炼平台调用专业版API接口,或直接访问通义万相官网使用网页端工具。此次发布标志着阿里巴巴在AI内容生成领域的技术积累已达到行业领先水平,为短视频创作者、广告从业者及普通用户提供了强大的生产力工具。