2025-12-02

Wan2.5系列模型正式发布

[summary]
首次实现音画同步的视频生成能力
视频生成时长从5秒提升至10秒，单次生成可实现更完整的剧情故事
支持24帧每秒的1080P高清视频生成

[header-link]
https://bailian.console.aliyun.com/?tab=api#/api/?type=model&url=2867393
API 体验链接

[video]
https://cloud.video.taobao.com/vod/dS_wlTTprl1vSaVgnqv-RoGHabsKBhCEdBZN-e_OSvg.mp4
https://img.alicdn.com/imgextra/i3/6000000003153/O1CN014LiFJ91ZA7tbP9KB8_!!6000000003153-0-tbvideo.jpg

近日，我们在2025杭州云栖大会上发布 通义万相 Wan2.5 Preview 系列模型，涵盖文生视频、图生视频、文生图和图像编辑四大模型，其中，通义万相2.5视频生成模型能生成和画面匹配的人声、音效和音乐BGM，首次实现音画同步的视频生成能力，进一步降低电影级视频创作的门槛。即日起，用户可在阿里云百炼平台调用API，或在通义万相官网直接体验。

相比前几代通义万相模型，通义万相2.5在技术架构上实现了重大更新：首次采用原生多模态架构，在同一套框架下支持理解和生成等多种任务，支持文本、图像、视频、音频多种模态的输入和输出，能实现音画同步的视频生成等多模态能力。用户输入提示词即可生成人声、环境音效和背景音乐，并且精准与画面内容、人物口型匹配，让视频演绎更加生动形象。通义万相2.5也支持输入一段音频作为参考，来驱动文字或图片生成音画同步的视频。

人声生视频

一张图和音频即可生成高质量的人物动态表演视频，不限画幅。泛化支持卡通、动物等形象，音频驱动细粒度面部及肢体的生动表达。

[video]
https://cloud.video.taobao.com/vod/BDAfJerYCE3Y7Hh3M1BZmbUOy-U4-VcWqTS7wqiNpOA.mp4
https://img.alicdn.com/imgextra/i2/6000000004595/O1CN013lPfgv1joZ1SIoQv1_!!6000000004595-0-tbvideo.jpg

[video]
https://cloud.video.taobao.com/vod/miM-aQTvLdujSHNTQcV6YuqRTzsGjdErQFRFq5WrFGY.mp4
https://img.alicdn.com/imgextra/i1/6000000001165/O1CN01hz1sC71KTcW227KDn_!!6000000001165-0-tbvideo.jpg

图生视频

更稳定自然的动态表现能力，对运镜可以稳定控制。指令遵循能力增强，对复杂变化和特效表现支持更好。对图像中已有特征可以稳定保持，如风格、人像、商品和文字等。

[video]
https://cloud.video.taobao.com/vod/DZFsL54vhlo2g0WpHlbjJjBGJq-WiCHf_vGp-jy_N2o.mp4
https://img.alicdn.com/imgextra/i2/6000000004715/O1CN01wV3k2X1khWYCNGYsr_!!6000000004715-0-tbvideo.jpg

提示词：跟随镜头，五名幽灵骑士骑着白马，他们的长袍在狂风中飘荡，马匹快速向前奔跑，尘土飞扬

[video]
https://cloud.video.taobao.com/vod/p_6dLD6l-SUOCuh7SX7ZG1xR039RLVIvaufYYOBoWjg.mp4
https://img.alicdn.com/imgextra/i3/6000000001433/O1CN01OykMzS1MSMf88xYKO_!!6000000001433-0-tbvideo.jpg

提示词：雨天一辆汽车在路上快速行驶，跟随镜头，天空突然打了一个闪电，闪电打到车上，车爆炸燃起大火

文生视频

电影级视觉控制，支持专业镜头语言描述，含光影、色彩，构图等，画面风格多变，表现细腻。更流畅稳定的大幅度动态能力；语义理解和遵循更强，更好还原创作意图。

[video]
https://cloud.video.taobao.com/vod/cTeI5lW_lAx5WhEotHCUymLHZ9b-5Duc7O74iW46GSU.mp4
https://img.alicdn.com/imgextra/i2/6000000007056/O1CN01GHh5o621zhjz3XGUR_!!6000000007056-0-tbvideo.jpg

[video]
https://cloud.video.taobao.com/vod/7w2oiapa2cNUK-L8rswdtUflFxhN1_cR4J6AcgGT0rY.mp4
https://img.alicdn.com/imgextra/i3/6000000001619/O1CN01MtPf3z1NpYKaR6Vu7_!!6000000001619-0-tbvideo.jpg

通义万相Wan模型家族

通义万相模型家族已支持文生图、文生视频、图生视频、人声生视频和动作生成等10多种视觉创作能力，累计生成3.9亿张图片、7000万个视频。自今年 2 月以来，通义万相已连续开源20多款模型，在开源社区和三方平台的下载量已超3000万。