阿里发布新一代千问旗舰模型Qwen3.7-Max，登顶最佳国产模型

核心突破

Qwen3.7-Max 在 Arena 全球大模型盲测总榜中超过 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，与 GPT、Claude、Gemini 等最强模型接近，位列国产模型第一。

在 MCP-Atlas、MCP-Mark、SkillBench 等现实能力测试中表现优异，超过 GLM-5.1、Kimi-K2.6 等模型，创下国产模型新高；在 Kernel Bench L3 上也展示出较强的 GPU 内核优化能力。

编程能力飞跃

Qwen3.7-Max 在 SWE-Pro、SWE-Multilingual、Terminal Bench 2.0-Terminus、SWE-bench 系列及 SciCode 等测评中表现领先，较 Qwen3.6-Plus 大幅提升，并超过 DeepSeek-v4-pro-Max、Claude-Opus4.6、Kimi-K2.6 等模型。

阿里内部的长程任务测试显示，Qwen3.7 被放到一个新硬件平台（平头哥真武 M890）上优化注意力内核，连续工作35小时，执行数百次内核评估和上千次工具调用，最终在参考实现基础上提升了一个数量级。

Agent 方向布局

千问 3.x 系列持续强化编程、长上下文、工具调用、跨框架兼容和长程任务处理能力。这些能力指向同一个变化——模型正在从回答问题，走向执行任务。

阿里把模型、云、MaaS、开发者工具和真实业务场景连接起来，参与 Agent 时代竞争。Qwen3.7-Max 的发布是这一链条中的重要节点。

MaaS 成为关键接口

阿里正在把芯片、云、模型、MaaS、开发者工具和应用入口连接起来。2026年阿里云峰会上，阿里云宣布面向 Agentic 时代升级，并发布新的"芯—云—模型—推理"技术体系。

目前，阿里云 AI 相关产品收入保持增长，MaaS 也被视为云业务的重要增长方向。公开信息显示，阿里 AI 模型和应用服务 ARR 已突破 80 亿元，百炼 MaaS 开发平台客户数截至 2026 年 3 月同比增长 8 倍，覆盖电商、金融、制造等多个行业。