除夕这天,阿里正式发布新一代大模型Qwen3.5

潮新闻客户端 记者 张云山

2 月 16 日除夕当天,阿里巴巴开源全新一代大模型千问 Qwen3.5-Plus,性能媲美 Gemini 3 Pro。

据悉,千问 3.5 实现了底层模型架构的全面革新。此次发布的 Qwen3.5-Plus 版本总参数为 3970 亿,激活仅 170 亿,以小胜大,性能超过万亿参数的 Qwen3-Max 模型,部署显存占用降低 60%,推理效率大幅提升,最大推理吞吐量可提升至 19 倍。Qwen3.5-Plus 的 API 价格每百万 Token 低至 0.8 元,仅为 Gemini 3 Pro 的 1/18。

与前几代的千问大语言模型不同,千问 3.5 实现了从纯文本模型到原生多模态模型的代际跃迁。千问 3 预训练在纯文本 Tokens 上进行,而千问 3.5 则基于视觉和文本混合 token 上预训练,并大幅新增中英文、多语言、STEM 和推理等数据,让张开 " 眼睛 " 的大模型学会了更密集的世界知识和推理逻辑,以不到 40% 的参数量获得超万亿的 Qwen3-Max 基座模型的性能,在推理、编程、Agent 智能体等全方位基准评估中均表现优异。

比如,千问 3.5 在 MMLU-Pro 知识推理评测中得分 87.8 分,超越 GPT-5.2;在博士级难题 GPQA 测评中斩获 88.4 分,高于 Claude 4.5;在指令遵循 IFBench 以 76.5 分刷新所有模型纪录;而在通用 Agent 评测 BFCL-V4、搜索 Agent 评测 Browsecomp 等基准中,千问 3.5 表现均超越 Gemini 3 Pro、GPT-5.2。

阿里开源千问 Qwen3.5-Plus,性能媲美 Gemini 3 Pro(受访者供图)

原生多模态训练,也带来千问 3.5 的视觉能力飞跃:在多模态推理(MathVison)、通用视觉问答 VQA(RealWorldQA)、文本识别和文件理解(CC_OCR)、空间智能(RefCOCO-avg)、视频理解(MLVU)等众多权威评测中,千问 3.5 均斩获最佳性能。

在学科解题、任务规划与物理空间推理等任务上,千问 3.5 相比千问专项模型 Qwen3-VL 表现更好,空间定位推理和带图推理能力均大幅增强,推理分析更精细、精准;在视频理解方面,千问 3.5 支持长达 2 小时(1M token 上下文)的视频直接输入,适用于长视频内容分析与摘要生成;同时,千问 3.5 实现了视觉理解与代码能力的原生融合,结合图搜和生图工具,可将手绘界面草图直接转为可用的前端代码,一张截图就能定位并修复 UI 问题,让视觉编程真正成为生产力工具。

千问 3.5 性能跃升的背后,是对 Transformer 经典架构的重大创新突破。千问团队自研的门控技术成果,曾斩获全球 AI 顶会 2025 NeurIPS 最佳论文,该前沿技术已融入千问 3.5 创新的混合架构中去,团队结合线性注意力机制与稀疏混合专家 MoE 模型架构,实现了 397B 总参数激活仅 17B 的极致模型效率;同时,千问 3.5 通过训练稳定优化以及多 token 预测等系列技术,Qwen3.5 性能与 Qwen3-Max 模型持平,并进一步提升了推理效率:在常用的 32K 上下文场景中,千问 3.5 推理吞吐量可提升 8.6 倍;在 256K 超长上下文情况下,Qwen3.5 推理吞吐量最大提升至 19 倍,推理效率大幅提升。

千问 3.5 推理效率大幅提升,最大吞吐量提升至 19 倍(受访者供图)

千问 3.5 的原生多模态训练,是在阿里云 AI 基础设施上高效完成的。通过系列基础技术创新,千问 3.5 在文本、图像、视频等混合数据训练吞吐量上,几近 100% 持平纯文本基座模型训练,大举降低了原生多模态训练的难度门槛;同时,通过设计精巧的 FP8、FP32 精度应用策略,在训练稳定扩展到数十万亿个 token 时,激活内存减少约 50% ,训练还能提速 10% ,进一步节约了模型训练成本、提升了训练效率。

基于顶级视觉能力,千问 3.5 也实现了从 Agent 框架到 Agent 应用的新突破。千问 3.5 可自主操作手机与电脑,高效完成日常任务,在移动端支持更多主流 APP 与指令,在 PC 端可处理更复杂的多步骤操作,如跨应用数据整理、自动化流程执行等,显著提升操作效率。同时,千问团队构建了一个可扩展的 Agent 异步强化学习框架,端到端可加速 3 到 5 倍,并将插件式智能体 Agent 支持扩展至百万级规模。

1 月 15 日,千问 App 发布全球首个消费级 AI 购物 Agent。春节期间,千问 AI 购物 Agent6 天时间帮用户完成了 1.2 亿笔订单,在全球首次实现大规模真实世界任务执行和商业化验证。Agent 能力大幅增强的千问 3.5,将进一步打开千问 APP 在工作和生活中帮人办事的想象空间。

自 2023 年开源以来,阿里已开源 400 多个千问模型,覆盖全尺寸、全模态,千问全球下载量突破 10 亿次,单月下载量是 DeepSeek、Meta、OpenAI、智谱、Kimi、MiniMax 等 2 到 8 名总和,开发者基于千问开发的衍生模型超 20 万,是公认的全球第一开源模型,也是开发者最友好的开源大模型。面向不同国家的 AI 开发者和企业的需求,千问大模型还在持续演进:千问 3.5 扩展支持 201 种语言,将词表大小从 15 万扩展到 25 万,可最高提升小语种 60% 的编码效率。

据悉,千问 APP、PC 端已第一时间接入 Qwen3.5-Plus 模型。开发者可在魔搭社区和 HuggingFace 下载新模型,或通过阿里云百炼直接获取 API 服务。阿里很快将继续开源不同尺寸、不同功能的千问 3.5 系列模型。性能更强的旗舰模型 Qwen3.5-Max 不久也将发布。