2025-12-02

Qwen3-VL-Flash上架百炼

[summary]
Qwen3系列小尺寸视觉理解模型
实现思考模式和非思考模式的有效融合
全面升级图像/视频理解，具备视觉2D/3D定位能力

[header-link]
https://bailian.console.aliyun.com/?tab=model#/model-market/detail/qwen3-vl-flash
API 体验链接

自 Qwen3-VL 开源发布以来，该模型在全球AI开源社区中收获的的广泛认可！在9月底的Chatbot Arena子榜单Vision Arena中，Qwen3-VL位居第二，是视觉理解领域中的全球开源冠军；同时，Qwen3-VL还斩获纯文本赛道（Text Arena）的开源第一（全球第8），成为首个揽获纯文本和视觉两大领域同时开源第一的大模型。并且，Qwen3-VL还在 OpenRouter 图像处理榜单上以 48% 的市场份额跃升至全球第一。

Qwen3-VL-Flash是Qwen3系列小尺寸视觉理解模型，实现思考模式和非思考模式的有效融合，效果优于开源版Qwen3-VL-30B-A3B，响应速度快。全面升级图像/视频理解，支持长视频长文档等超长上下文、空间感知与万物识别；具备视觉2D/3D定位能力，胜任复杂现实任务。

模型评测：qwen3-vl-flash效果超过上一代qwen2.5-vl-72b

官方CookBook

Qwen3-VL发布后受到社区的广泛好评，官方也在最近推出了CookBook指南，这些 Cookbook 围绕真实场景设计，覆盖高精度文档解析、多语言自然场景 OCR、长视频理解、3D 物体定位、空间关系推理，以及面向移动端和计算机操作的智能体控制等核心能力，全面展现 Qwen3-VL 在复杂视觉语言任务中的强大表现。欢迎试用、反馈，并与我们一起拓展多模态大模型的应用边界。

Github