[summary]
阿里巴巴通义实验室系列模型
已成为全球第一开源模型,也是中国企业选择最多的模型
超100万家客户接入通义大模型[header-link]
https://tongyi.aliyun.com/
了解通义
通义大模型是阿里巴巴通义实验室系列模型,自 2014 年成立 iDST 研究院(数据科学与技术研究院,达摩院的前身)起,阿里巴巴便开始投入人工智能核心技术的研发。2017年10月,达摩院正式成立,同年阿里云推出中国首个机器学习平台PAI(Platform of AI)。2020年,多模态大模型M6项目启动;2021年10月,M6模型参数规模跃升至十万亿级,成为全球首个参数规模达 10 万亿的多模态大模型。
2022年,通义实验室正式成立。依托M6大模型等研究积累,2022年9月,“通义”系列大模型正式发布,标志着通义千问项目的正式启动。2023年4月,通义千问大语言模型系列正式发布。2023年7月,通义万相视觉生成模型系列发布。2025年9月,语音模型FunAudio系列发布。与此同时,通义实验室还在大模型工程等人工智能领域进行研究,发布了 DeepResearch、WebDev、Qwen-Agent、EvalScope、ms-swift、AgentScope 等多项研究成果与应用。
通义大模型已成为全球第一开源模型,也是中国企业选择最多的模型。截至目前,阿里通义开源300余个模型,覆盖不同大小的“全尺寸”及LLM、编程、图像、语音、视频等“全模态”,全球下载量突破6亿次,全球衍生模型17万个,稳居全球第一。超100万家客户接入通义大模型,权威调研机构沙利文2025上半年报告显示,在中国企业级大模型调用市场中,阿里通义占比第一。


2024年,在Gartner、IDC、Forrester及Omdia等多家国际权威机构的评估报告中,阿里巴巴在人工智能综合能力及大模型产品方面表现突出,位居国内榜首,并跻身全球前列。在《Innovation Guide for Generative AI Technologies》(生成式AI技术创新指南)中,阿里巴巴入选全部新兴代表类别:在AI模型供应商维度,其“功能完备性”获全球最高评价;在AI工程新兴领域,“功能”与“未来潜力”两项评分排名全球第二;在AI知识管理与生产力新兴市场,“未来潜力”位列全球第一,“功能”排名第二。
通义系列大模型在多条技术路线持续迭代,性能迅速提升,始终与国际先进水平保持同步。2025年,该家族多个模型已在全球处于领先地位。
1、混合推理大模型,它相当于把顶尖推理模型和非推理模型集成到同一个模型里:通义千问Qwen3作为国内首款融合“快思考”与“慢思考”能力的混合推理模型,可针对不同复杂度任务自适应调配算力,在AIME25数学推理、LiveCodeBench编程评测中均取得最优成绩,其增强的Agent能力,原生支持MCP协议与复杂工具调用,在BFCL智能体评估中以70.8分领先Gemini2.5-Pro、OpenAI-o1等闭源模型。通义7月开源了编程模型Qwen3-coder,在代码能力及Agent调用能力方面取得重大突破,编程能力登顶全球开源模型阵营,据海外大模型API聚合平台OpenRouter统计,其单周调用量增长达1474%,跃居编程类模型第二。
2、多模态理解模型,大模型从“听懂世界”到“全方位理解世界”:通义千问在多模态感知与推理方面持续领先,Qwen-VL在文档与中文图像理解上超越GPT-4V,Qwen-Audio在音频理解任务中主流指标排名第一。3月发布的QVQ-Max模型,在融合图像、视频与文本的联合推理任务中展现出更全面的认知与推断能力。
3、视觉生成大模型,理解并模拟现实世界的运行规律:2024年9月通义实验室正式发布通义万相Wan系列视觉生成大模型,并在2025年2月首次开源Wan2.1,在Vbench评测中超过Sora、Pika等国内外同类模型,六天内登顶HuggingFace双榜。7月推出全球首个开源的 MoE 架构的视频生成模型Wan2.2,进一步引入电影级美学控制参数,支持60多项视觉元素精细调控,显著提升高质量视频内容生成效率。通义万相系列累计下载已突破500万,成为最受欢迎的开源视频生成模型之一。
4、端到端多模态模型,致力于让大模型真正具备“类人”的交互能力:通义千问Qwen2.5-Omni作为全球首个开源端到端多模态模型,可流畅处理文本、图像、音频和视频输入,并支持实时交互响应,在所有模态任务上性能均超越同规模单模态模型及Gemini-1.5-pro等闭源系统。
阿里巴巴坚信,开源是实现人工智能技术创新、产业协作与国际竞争的关键机制。作为国内唯一全面推行大模型开源的大型科技企业,阿里巴巴通过开放算力、开源模型、ModelScope社区与阿里云百炼平台共同推动行业生态繁荣。
通义模型家族秉持“全尺寸、跨模态、广开源”策略,涵盖从轻量化端侧模型到超大规模企业级模型的完整谱系,包括语言、推理、多模态、数学与代码等多种类型。在Hugging face社区9月底公布的模型榜单中,通义夺冠并在前十名里占据了七席。
阿里巴巴“通义千问”不仅模型性能全球领先,而且从推出的第一天起就坚定选择开源路线,全力支持开发者生态建设,与全球开发者一起探索AI应用的无限可能。经过三年的持续开放,“通义千问”已经成为全球最具影响力的开源模型家族,总共开源了300多个模型,涵盖全模态、全尺寸,全球下载量突破6亿次,衍生模型超过17万个,位居全球第一。
为推动大模型在各行业的规模化应用,阿里巴巴于2022年率先在国内提出“模型即服务”(MaaS)理念,重新定义以模型为核心的云服务架构。
同年通义实验室发起的开源社区ModelScope(魔搭社区),目前已汇聚超1600万用户、8.18万个模型和1万个高质量数据集,成为中国最具影响力的大模型首发平台之一。2023年8月推出的阿里云百炼平台,整合全球优质模型,提供模型选型、精调、部署与安全支持等服务,帮助开发者在几分钟内构建大模型应用,几小时内训练出企业专用模型。截至2025年5月,该平台服务企业及开发者超98万,成为中小企业实现智能化转型的核心工具。
几年来模型的尺寸增长数千倍,但模型的算力成本却在持续下降,企业使用模型的成本也越来越低,周靖人强调:“这是AI基础设施全面革新带来的技术红利,我们会持续投入先进AI基础设施的建设,加速大模型走进千行百业。”2025年H1中国企业级大模型日均掉用量已达10万亿tokens,比2024下半年增长363%,在中国企业级大模型调用市场上,阿里通义系列大模型调用量占比17.7%排名第一,成为目前市场选择最多的大模型。
人工智能时代已经到来,“AI+云”正持续成为数字创新基础。阿里巴巴将继续响应国家科技战略,强化人工智能基础设施,拓宽开源生态,最大化科技企业的社会价值。
通义实验室由阿里巴巴集团设立的全球性科研机构达摩院孵化而来。
2014 年,阿里巴巴集团成立 iDST 研究院(数据科学与技术研究院),启动人工智能核心技术的研发。2017年10月,达摩院正式成立。
2020年,多模态大模型M6项目启动;2021年10月,M6模型参数规模跃升至十万亿级,成为全球首个参数规模达 10 万亿的多模态大模型
2022年,通义实验室正式成立。同年通义千问项目正式启动。
2023年4月,通义千问(Qwen)大语言模型正式发布。2023年8月,通义千问Qwen-7B正式开源,成为Qwen系列首个开源模型。2024年2月,通义千问Qwen1.5系列发布。2024年6月,Qwen2系列模型发布。2024年9月,Qwen2.5系列发布。2025年4月,Qwen3系列模型发布。除大语言模型外,通义千问模型系列还包括编程模型、长文本模型、翻译模型、推理模型、文本嵌入模型、以及面向视觉、图片与音频的多模态大模型与全模态大模型等多种模型种类。
2023年7月, 通义万相(Wan)正式发布。2025年2月,wan2.1系列正式发布并开源,2025年7月,wan2.2系列视频生成模型正式发布并开源,2025年9月,Wan2.5-Preview发布,2025年12月,Wan2.6系列发布。通义万相系列模型包括文生音视频、图生音视频、声音生视频、视频编辑、文生图、图片编辑、数字人等多种功能模型。
2025年9月,通义实验室推出首个深度研究Agent开源模型Deep Research。
2025年9月,通义实验室推出AgentScope开源智能体开发框架,聚焦多智能体应用场景,提供覆盖开发、部署与监控全生命周期的生产级解决方案。
2025年9月,通义百聆(Tongyi Fun )企业级语音基座大模型系列正式发布,由语音识别大模型Fun-ASR、语音合成大模型Fun-CosyVoice构成。

通义千问是阿里巴巴集团下属人工智能实验室通义实验室发布的模型家族。除大语言模型外,通义千问模型家族还覆盖编程模型、长文本模型、翻译模型、推理模型、文本嵌入模型、以及面向视觉、图片与音频的多模态大模型与全模态大模型等多种模型种类。
· 大语言模型: 大语言模型是指使用大量文本数据训练的深度学习模型,使得该模型可以生成自然语言文本或理解语言文本的含义。通义千问系列第一款开源大语言模型Qwen-7B于2023年8月发布并开源,后续陆续发布Qwen1.5、Qwen2、Qwen2.5、Qwen3等多代际大语言基座模型。
· 代码模型:代码模型是专为处理编程代码设计的AI模型,能够生成、理解、调试代码,并通过模拟执行过程提升代码质量与可靠性。通义千问系列推出多个代码大模型,包括CodeQwen1.5、Qwen2.5-Coder、Qwen3-Coder。
· 推理模型:通义千问系列的推理模型包括开源推理大模型QWQ(Qwen with Questions)以及开源多模态推理模型QvQ。
· 数学模型:AI数学模型是人工智能领域用于实现特定任务的系统化数学工具。通义千问的数学模型包括Qwen2-Math、Qwen2.5-Math等。
· 嵌入模型:嵌入模型是将文本、图像等非结构化数据转化为数学向量的核心技术。Qwen3 Embedding系列模型建立在Qwen3基础模型之上,支持文本嵌入、检索、重排等功能的实现。
· 机器翻译模型: 通义千问系列推出多款机器翻译模型,包括多语种翻译模型Qwen-MT,以及实时翻译模型Qwen3‑LiveTranslate。
· 视觉语言模型:视觉语言模型是多模态生成式人工智能系统,通过结合大语言模型与视觉编码器实现图像、文本、视频的综合处理能力。通义千问发布的视觉模型包括Qwen-VL、Qwen2-VL、Qwen2.5-VL、Qwen VLo、Qwen3-VL等。
· 图像基础模型 :2025年8月,通义千问发布图像基础模型 Qwen-Image 以及图像编辑模型 Qwen-Image-Edit。
· 语音模型: 通义千问系列包括多款面向音频的多模态大模型,包括音频语音模型Qwen-Audio、Qwen2-Audio,Text To Speech 模型Qwen-TTS、语音识别模型Qwen3-ASR。
· 多模态模型:2025年3月,通义千问发布全模态大模型Qwen2.5-Omni,2025年9月发布原生端到端多语种全模态大模型Qwen3-Omni。

通义万相是阿里巴巴集团下属人工智能实验室通义实验室发布的视觉生成模型系列,支持图片生成与编辑、视频生成与编辑功能,涵盖文生音视频、图生音视频、声音生视频、视频编辑、文生图、图片编辑、数字人等多种功能模型。
· 视频生成模型: 通义万相系列模型包括多款视频生成模型,包括文字生视频模型Wan2.6-t2v,图生视频模型Wan2.6-i2v,参考生视频Wan2.6-r2v,首尾帧生视频模型Wan2.1-FLF2V,一体化视频创作与编辑模型Wan2.1-VACE,声音生视频模型Wan2.2-S2V,多模态视频生成模型Wan2.5-T2V-Preview,Wan2.5-I2V-Preview。
· 文生图系列模型:Wan2.6发布文生图系列模型,包括Wan2.6-t2i,Wan2.6-image。
· 数字人视频生成模型:通义万相在数字人视频生成领域发布并开源多款模型。包括人声生视频(数字人视频生成)模型Wan2.2-S2V,以及支持动作模仿和角色扮演两种模式的数字人生成模型Wan2.2-Animate。

通义百聆是阿里巴巴集团下属人工智能实验室通义实验室发布的语音模型家族,由语音识别大模型Fun-ASR、语音合成大模型Fun-CosyVoice组成。
· 语音识别大模型:Fun-ASR基于数千万小时真实语音数据训练而成,具备强大的上下文理解能力与行业适应性,该模型增强了上下文感知和高精度语音转写能力,目前,Fun-ASR 已应用于会议字幕与同传、智能纪要、语音助手等场景,未来该模型将进一步在阿里云百炼上线。
· 语音合成大模型:Fun-CosyVoice可提供上百种预制音色,不仅能生成符合特定性别、年龄和个性的声音,还能模拟人类说话时的自然特征,如笑声、咳嗽和呼吸,甚至可以为生成的声音添加情感和风格,使AI的表达更加丰富多彩。该模型可用于客服、销售、直播电商、消费电子、有声书、儿童娱乐等场景。

DeepResearch:DeepResearch是通义团队于2025年9月推出的首个深度研究Agent开源模型。
WebDev:WebDev是通义推出的网页开发功能,用户可通过自然语言指令快速生成网页代码,支持预览和自定义优化。
Qwen-Agent:Qwen-Agent 是通义发布的一个开发框架。开发者可基于本框架开发 Agent 应用,充分利用基于通义千问模型(Qwen)的指令遵循、工具使用、规划、记忆能力。本项目也提供了浏览器助手、代码解释器、自定义助手等示例应用。
EvalScope:EvalScope是由通义实验室开发的模型评测与性能基准测试框架,主要用于评估各类大模型的性能表现。
ms-swift:ms-swift是一款轻量级、可扩展的大模型微调与部署框架,支持对超过 500 个大语言模型(LLM)和 200 多个多模态大模型(MLLM)进行高效微调、推理、评估、量化和部署。
AgentScope:AgentScope 1.0是阿里通义实验室于2025年9月2日推出的开源智能体开发框架,聚焦多智能体应用场景,提供覆盖开发、部署与监控全生命周期的生产级解决方案。
追星星的AI
在2024世界人工智能大会上,阿里巴巴携手上海美术电影制片厂、中国青少年发展基金会“阅读中国”基金,孤独症儿童干预机构恒星乐乐、海豚乐乐,联合发布公益产品“追星星的AI”。这也是国内首个关照孤独症儿童的AI绘本工具。“追星星的AI”基于阿里自研ModelScope-Agent框架,调用了通义大模型的多项服务。
9月25日下午,面向孤独症儿童的AI绘本工具“追星星的AI”在2025云栖大会发布2.0版本,文图模型全面升级,并实现了家长声音复刻、故事广场等多项新增功能。2.0版本得到南京特殊教育师范学院专家团的系统指导,用户只要输入一句话指令并设置个性化元素,AI即可自动生成适合孤独症儿童的绘本故事。
更新后的产品文本侧采用通义最新发布的Qwen-doc-turbo模型,支持超长上下文输入,可完整摄入专业特教指导文档、经典绘本结构模板、情绪发展心理学资料等丰富提示素材,并充分理解角色发展、情绪递进、教育目标与年龄适配性;与生图模型Qwen-image-edit协同后,更可实现“文图语义对齐”,让每一页文字与画面共同服务于教育目标,配合产品侧创新工作流,实现跨页角色形象、色彩体系与构图风格的高度统一。

李白数字人
9月10日,通义推出数字人李白,基于通义大模型打造,集合通义多模态技术实力,不仅在外貌上还原唐代诗人李白的中年形象,更在眼神、言谈举止间融入对李白诗词意境的理解与艺术再现。
贵州省雷山县第二届诗词大会现场,阿里巴巴通义数字人李白作为特邀“出题官”惊艳登场,呈现AI与古典文化在教育领域的融合实践。该比赛由阿里公益和贵州省黔东南苗族侗族自治州雷山县人民政府联合举办,来自雷山县4所小学的20名受教于“李白”的学生同台竞技,展示少年眼中的中华诗词之美。
AI眼镜帮助视障人群
10月24日,上海魔搭社区开发者“帆哥”及其团队历时半年,开发了一款轻便、低成本的AI眼镜,可辅助视障人群实时识别盲道、红绿灯、斑马线及障碍物,并通过语音交互引导视障人士安全出行。
该设备以开源模型通义千问Qwen—Omni为技术基座,整套硬件成本仅百元左右,所有代码、硬件清单及3D模型均已在魔搭社区开源。“盲人AI眼镜”也参与了中国最大开发者社区魔搭与阿里巴巴公益共同发起的“「小有可为」AI开源公益挑战赛”。