帮助中心

重磅!通义千问2.5正式发布—2024年5月24日

通义大模型发布一周年之际,迎来重要的历史性时刻!

阿里云正式发布通义千问2.5,并开源通义千问1100亿参数模型。

通义千问2023年4月问世以来,始终专注于基础模型的技术研发,从初代模型升级至2.5版本。相比上一版本,2.5版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。

同时,通义发布1100亿参数开源模型Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列业界最强的竞争力。

图|HuggingFace开源大模型排行榜

通义在多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,这款模型是国内用户规模第一的智能编码助手通义灵码的底座。

一年间,通义发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从APP、官网和小程序免费使用通义。同时原通义千问APP于今天正式宣布更名为“通义APP”,将通义大模型全套能力集于一身,致力于成为“通情达义”的AI助手。


坚定开源路线

通义是大模型开源最积极的推动者和实践者。去年8月,通义宣布加入开源行列,随之启动马不停蹄的开源狂飙,沿着“全模态、全尺寸”开源的路线,陆续推出十多款开源模型。目前,通义开源模型下载量已经超过700万。

大模型的训练和迭代成本极高,绝大部分的AI开发者和中小企业都无法负担。阿里云始终坚持推动大模型开源,让开发者们不必从头训练模型,还把模型选型的主动权交给了开发者,大大加速了大模型的应用落地进程。

为顺应不同场景用户的需求,通义推出参数规模横跨5亿到1100亿的八款大语言模型,小尺寸模型如0.5B、1.8B、4B、7B、14B,可便捷地在手机、PC等端侧设备部署;大尺寸模型如72B、110B能支持企业级和科研级的应用;中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。此外,通义还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。

通义72B、110B开源模型都曾登顶Open LLM Leaderboard榜首。在开放研究机构LMSYS Org推出的基准测试平台Chatbot Arena上,通义72B模型多次进入“盲测”结果全球Top 10,创造了国产大模型的先例。长期沉淀的良好口碑为通义开源模型赢得一众铁粉,每有开源动作都会早早被开发者“蹲守”,也总能获得生态伙伴第一时间支持。

图|生态伙伴社区反馈

阿里云CTO周靖人表示:“开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力。” 未来通义大模型还会持续开源。

更多内容:https://developer.aliyun.com/article/1518261?spm=a2c6h.13262185.profile.103.49f947e7lBYPqc