[summary]
首次实现音画同步的视频生成能力
视频生成时长从5秒提升至10秒,单次生成可实现更完整的剧情故事
支持24帧每秒的1080P高清视频生成[header-link]
https://bailian.console.aliyun.com/?tab=api#/api/?type=model&url=2867393
API 体验链接[video]
https://cloud.video.taobao.com/vod/dS_wlTTprl1vSaVgnqv-RoGHabsKBhCEdBZN-e_OSvg.mp4
https://img.alicdn.com/imgextra/i3/6000000003153/O1CN014LiFJ91ZA7tbP9KB8_!!6000000003153-0-tbvideo.jpg近日,我们在2025杭州云栖大会上发布 通义万相 Wan2.5 Preview 系列模型,涵盖文生视频、图生视频、文生图和图像编辑四大模型,其中,通义万相2.5视频生成模型能生成和画面匹配的人声、音效和音乐BGM,首次实现音画同步的视频生成能力,进一步降低电影级视频创作的门槛。即日起,用户可在阿里云百炼平台调用API,或在通义万相官网直接体验。

相比前几代通义万相模型,通义万相2.5在技术架构上实现了重大更新:首次采用原生多模态架构,在同一套框架下支持理解和生成等多种任务,支持文本、图像、视频、音频多种模态的输入和输出,能实现音画同步的视频生成等多模态能力。用户输入提示词即可生成人声、环境音效和背景音乐,并且精准与画面内容、人物口型匹配,让视频演绎更加生动形象。通义万相2.5也支持输入一段音频作为参考,来驱动文字或图片生成音画同步的视频。
一张图和音频即可生成高质量的人物动态表演视频,不限画幅。泛化支持卡通、动物等形象,音频驱动细粒度面部及肢体的生动表达。
[video]
https://cloud.video.taobao.com/vod/BDAfJerYCE3Y7Hh3M1BZmbUOy-U4-VcWqTS7wqiNpOA.mp4
https://img.alicdn.com/imgextra/i2/6000000004595/O1CN013lPfgv1joZ1SIoQv1_!!6000000004595-0-tbvideo.jpg[video]
https://cloud.video.taobao.com/vod/miM-aQTvLdujSHNTQcV6YuqRTzsGjdErQFRFq5WrFGY.mp4
https://img.alicdn.com/imgextra/i1/6000000001165/O1CN01hz1sC71KTcW227KDn_!!6000000001165-0-tbvideo.jpg更稳定自然的动态表现能力,对运镜可以稳定控制。指令遵循能力增强,对复杂变化和特效表现支持更好。对图像中已有特征可以稳定保持,如风格、人像、商品和文字等。
[video]
https://cloud.video.taobao.com/vod/DZFsL54vhlo2g0WpHlbjJjBGJq-WiCHf_vGp-jy_N2o.mp4
https://img.alicdn.com/imgextra/i2/6000000004715/O1CN01wV3k2X1khWYCNGYsr_!!6000000004715-0-tbvideo.jpg提示词:跟随镜头,五名幽灵骑士骑着白马,他们的长袍在狂风中飘荡,马匹快速向前奔跑,尘土飞扬
[video]
https://cloud.video.taobao.com/vod/p_6dLD6l-SUOCuh7SX7ZG1xR039RLVIvaufYYOBoWjg.mp4
https://img.alicdn.com/imgextra/i3/6000000001433/O1CN01OykMzS1MSMf88xYKO_!!6000000001433-0-tbvideo.jpg提示词:雨天一辆汽车在路上快速行驶,跟随镜头,天空突然打了一个闪电,闪电打到车上,车爆炸燃起大火
电影级视觉控制,支持专业镜头语言描述,含光影、色彩,构图等,画面风格多变,表现细腻。更流畅稳定的大幅度动态能力;语义理解和遵循更强,更好还原创作意图。
[video]
https://cloud.video.taobao.com/vod/cTeI5lW_lAx5WhEotHCUymLHZ9b-5Duc7O74iW46GSU.mp4
https://img.alicdn.com/imgextra/i2/6000000007056/O1CN01GHh5o621zhjz3XGUR_!!6000000007056-0-tbvideo.jpg[video]
https://cloud.video.taobao.com/vod/7w2oiapa2cNUK-L8rswdtUflFxhN1_cR4J6AcgGT0rY.mp4
https://img.alicdn.com/imgextra/i3/6000000001619/O1CN01MtPf3z1NpYKaR6Vu7_!!6000000001619-0-tbvideo.jpg通义万相模型家族已支持文生图、文生视频、图生视频、人声生视频和动作生成等10多种视觉创作能力,累计生成3.9亿张图片、7000万个视频。自今年 2 月以来,通义万相已连续开源20多款模型,在开源社区和三方平台的下载量已超3000万。
