AI大模型QwenAgent

阿里发布新一代千问旗舰模型Qwen3.7-Max,登顶最佳国产模型

150 克··原文链接
收录于 2026/5/21 08:42:17

核心突破

Qwen3.7-Max 在 Arena 全球大模型盲测总榜中超过 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与 GPT、Claude、Gemini 等最强模型接近,位列国产模型第一。

在 MCP-Atlas、MCP-Mark、SkillBench 等现实能力测试中表现优异,超过 GLM-5.1、Kimi-K2.6 等模型,创下国产模型新高;在 Kernel Bench L3 上也展示出较强的 GPU 内核优化能力。

编程能力飞跃

Qwen3.7-Max 在 SWE-Pro、SWE-Multilingual、Terminal Bench 2.0-Terminus、SWE-bench 系列及 SciCode 等测评中表现领先,较 Qwen3.6-Plus 大幅提升,并超过 DeepSeek-v4-pro-Max、Claude-Opus4.6、Kimi-K2.6 等模型。

阿里内部的长程任务测试显示,Qwen3.7 被放到一个新硬件平台(平头哥真武 M890)上优化注意力内核,连续工作35小时,执行数百次内核评估和上千次工具调用,最终在参考实现基础上提升了一个数量级。

Agent 方向布局

千问 3.x 系列持续强化编程、长上下文、工具调用、跨框架兼容和长程任务处理能力。这些能力指向同一个变化——模型正在从回答问题,走向执行任务。

阿里把模型、云、MaaS、开发者工具和真实业务场景连接起来,参与 Agent 时代竞争。Qwen3.7-Max 的发布是这一链条中的重要节点。

MaaS 成为关键接口

阿里正在把芯片、云、模型、MaaS、开发者工具和应用入口连接起来。2026年阿里云峰会上,阿里云宣布面向 Agentic 时代升级,并发布新的"芯—云—模型—推理"技术体系。

目前,阿里云 AI 相关产品收入保持增长,MaaS 也被视为云业务的重要增长方向。公开信息显示,阿里 AI 模型和应用服务 ARR 已突破 80 亿元,百炼 MaaS 开发平台客户数截至 2026 年 3 月同比增长 8 倍,覆盖电商、金融、制造等多个行业。