除夕这天，阿里正式发布新一代大模型Qwen3.5

潮新闻客户端记者张云山

2 月 16 日除夕当天，阿里巴巴开源全新一代大模型千问 Qwen3.5-Plus，性能媲美 Gemini 3 Pro。

据悉，千问 3.5 实现了底层模型架构的全面革新。此次发布的 Qwen3.5-Plus 版本总参数为 3970 亿，激活仅 170 亿，以小胜大，性能超过万亿参数的 Qwen3-Max 模型，部署显存占用降低 60%，推理效率大幅提升，最大推理吞吐量可提升至 19 倍。Qwen3.5-Plus 的 API 价格每百万 Token 低至 0.8 元，仅为 Gemini 3 Pro 的 1/18。

与前几代的千问大语言模型不同，千问 3.5 实现了从纯文本模型到原生多模态模型的代际跃迁。千问 3 预训练在纯文本 Tokens 上进行，而千问 3.5 则基于视觉和文本混合 token 上预训练，并大幅新增中英文、多语言、STEM 和推理等数据，让张开 " 眼睛 " 的大模型学会了更密集的世界知识和推理逻辑，以不到 40% 的参数量获得超万亿的 Qwen3-Max 基座模型的性能，在推理、编程、Agent 智能体等全方位基准评估中均表现优异。

比如，千问 3.5 在 MMLU-Pro 知识推理评测中得分 87.8 分，超越 GPT-5.2；在博士级难题 GPQA 测评中斩获 88.4 分，高于 Claude 4.5；在指令遵循 IFBench 以 76.5 分刷新所有模型纪录；而在通用 Agent 评测 BFCL-V4、搜索 Agent 评测 Browsecomp 等基准中，千问 3.5 表现均超越 Gemini 3 Pro、GPT-5.2。

阿里开源千问 Qwen3.5-Plus，性能媲美 Gemini 3　Pro（受访者供图）

原生多模态训练，也带来千问 3.5 的视觉能力飞跃：在多模态推理（MathVison）、通用视觉问答 VQA（RealWorldQA）、文本识别和文件理解（CC_OCR）、空间智能（RefCOCO-avg）、视频理解（MLVU）等众多权威评测中，千问 3.5 均斩获最佳性能。

在学科解题、任务规划与物理空间推理等任务上，千问 3.5 相比千问专项模型 Qwen3-VL 表现更好，空间定位推理和带图推理能力均大幅增强，推理分析更精细、精准；在视频理解方面，千问 3.5 支持长达 2 小时（1M token 上下文）的视频直接输入，适用于长视频内容分析与摘要生成；同时，千问 3.5 实现了视觉理解与代码能力的原生融合，结合图搜和生图工具，可将手绘界面草图直接转为可用的前端代码，一张截图就能定位并修复 UI 问题，让视觉编程真正成为生产力工具。

千问 3.5 性能跃升的背后，是对 Transformer 经典架构的重大创新突破。千问团队自研的门控技术成果，曾斩获全球 AI 顶会 2025 NeurIPS 最佳论文，该前沿技术已融入千问 3.5 创新的混合架构中去，团队结合线性注意力机制与稀疏混合专家 MoE 模型架构，实现了 397B 总参数激活仅 17B 的极致模型效率；同时，千问 3.5 通过训练稳定优化以及多 token 预测等系列技术，Qwen3.5 性能与 Qwen3-Max 模型持平，并进一步提升了推理效率：在常用的 32K 上下文场景中，千问 3.5 推理吞吐量可提升 8.6 倍；在 256K 超长上下文情况下，Qwen3.5 推理吞吐量最大提升至 19 倍，推理效率大幅提升。

千问 3.5 推理效率大幅提升，最大吞吐量提升至 19 倍（受访者供图）

千问 3.5 的原生多模态训练，是在阿里云 AI 基础设施上高效完成的。通过系列基础技术创新，千问 3.5 在文本、图像、视频等混合数据训练吞吐量上，几近 100% 持平纯文本基座模型训练，大举降低了原生多模态训练的难度门槛；同时，通过设计精巧的 FP8、FP32 精度应用策略，在训练稳定扩展到数十万亿个 token 时，激活内存减少约 50% ，训练还能提速 10% ，进一步节约了模型训练成本、提升了训练效率。

基于顶级视觉能力，千问 3.5 也实现了从 Agent 框架到 Agent 应用的新突破。千问 3.5 可自主操作手机与电脑，高效完成日常任务，在移动端支持更多主流 APP 与指令，在 PC 端可处理更复杂的多步骤操作，如跨应用数据整理、自动化流程执行等，显著提升操作效率。同时，千问团队构建了一个可扩展的 Agent 异步强化学习框架，端到端可加速 3 到 5 倍，并将插件式智能体 Agent 支持扩展至百万级规模。

1 月 15 日，千问 App 发布全球首个消费级 AI 购物 Agent。春节期间，千问 AI 购物 Agent6 天时间帮用户完成了 1.2 亿笔订单，在全球首次实现大规模真实世界任务执行和商业化验证。Agent 能力大幅增强的千问 3.5，将进一步打开千问 APP 在工作和生活中帮人办事的想象空间。

自 2023 年开源以来，阿里已开源 400 多个千问模型，覆盖全尺寸、全模态，千问全球下载量突破 10 亿次，单月下载量是 DeepSeek、Meta、OpenAI、智谱、Kimi、MiniMax 等 2 到 8 名总和，开发者基于千问开发的衍生模型超 20 万，是公认的全球第一开源模型，也是开发者最友好的开源大模型。面向不同国家的 AI 开发者和企业的需求，千问大模型还在持续演进：千问 3.5 扩展支持 201 种语言，将词表大小从 15 万扩展到 25 万，可最高提升小语种 60% 的编码效率。

据悉，千问 APP、PC 端已第一时间接入 Qwen3.5-Plus 模型。开发者可在魔搭社区和 HuggingFace 下载新模型，或通过阿里云百炼直接获取 API 服务。阿里很快将继续开源不同尺寸、不同功能的千问 3.5 系列模型。性能更强的旗舰模型 Qwen3.5-Max 不久也将发布。