Qwen3.7-Max重新定义AI Agent基座

2026年5月20日

64

372

Qwen3.7-Max重新定义AI Agent基座

在AI Agent领域,一个普遍存在的痛点是:Demo演示惊艳,但一旦投入生产环境就频繁崩溃。任务稍长就丢失上下文,换个框架性能就大幅下降,运行几轮后便陷入“自我循环”。开发者真正需要的是一个能够理解意图、规划路径、持续迭代并可靠交付的智能体基座。

极限压力测试:35小时自主优化Kernel

2026年5月,Qwen3.7-Max正式发布,在多项权威评测中斩获国内第一的成绩。更重要的是,它在35小时连续自主执行、1158次工具调用零中断的极限测试中证明:长程智能体的稳定性不再是理论可能,而是工程现实。

环境多样性训练:实现长程稳定性的核心

研发团队为Qwen3.7-Max布置了一个极具挑战性的任务:在一块训练期从未见过的硬件平台(ZW-M890L PPU)上,自主优化SGLang的Extend Attention生产级Kernel。没有硬件文档、没有性能分析数据,起点仅有任务描述、官方Triton参考实现和一个评估脚本。在约35小时的连续运行中,模型共产出432次kernel评估,跨越1158次工具调用。它完全自主地编写、编译、性能分析并迭代CUDA Kernel,诊断编译报错、修复正确性Bug,通过运行时测量定位瓶颈并多次重构底层架构。最终在多个工作负载上实现10.0x几何平均加速。

能跑35小时不断片,靠的不是偶然。上千次调用中始终保持策略连贯的底气,来自训练阶段对“环境多样性”的彻底重构。

“技术团队”
🦞

JimoClaw — 桌面 AI Agent 工作台

让 AI 处理本地资料、操控浏览器,最终交付可直接使用的文档、表格与 PPT,而不只是一段回答。

下载桌面版

跨框架泛化:正交解耦设计

Qwen3.7-Max的训练架构采用了“任务-运行框架-验证器”正交解耦设计。在强化学习阶段,模型被强制在不同框架、不同验证器组合下处理同源任务。它学到的不是某个框架的快捷键,而是通用的解题策略与工具调用范式。这意味着无论使用Claude Code、OpenClaw、Qwen Code,还是自研的Tool Use框架,Qwen3.7-Max都能即插即用,性能表现高度一致。

真实生产力场景应用

面向真实生产力场景,Qwen3.7-Max展现出强大的专业工作流重塑能力。在编程智能体方面,模型可以通过一条prompt生成丰富的交互式Web应用,包括Three.js 3D场景、Canvas动画、完整页面布局和动态SVG。在办公生产力方面,通过MCP工具集成,模型可以充当智能办公助手,自动修复排版混乱的论文,包括页面布局、标题样式、字体字号、页眉页脚、目录生成和参考文献格式。此外,模型还支持主Agent规划调度、子Agent垂直执行的多智能体编排,并可基于Tool Use直接操控具身设备完成真实物理环境中的理解、规划与决策。

🛡️

积墨 AI 安全隐患巡检系统

任务一键下达 · 隐患 AI 识别 · 整改全程留痕 · 报告一键生成。让安全巡检真正看得见、管得住、能闭环。

了解方案

如有侵权,请联系删除。

Related Articles

联系我们 免费试用
小墨 AI