阿里云千问 Qwen3.7-Max-Preview / Plus-Preview 上线 Qwen Chat 与 Arena AI,暂仅支持思考模式

5 月 19 日,IT之家报道称,Qwen3.7-Max-Preview 和 Qwen3.7-Plus-Preview 已经上线 Qwen Chat 与 Arena AI(原 LMArena)。报道同时提到,这两款预览模型有望在 5 月 20 日的阿里云峰会上正式发布。
两款预览模型当前都只支持思考模式,搜索与代码解释器工具暂不可用。对把模型接进工程工作流的人来说,这意味着它更适合先做纯文本推理、解题与代码理解类的对比,而不是直接拿来跑带工具的多步任务。
Arena AI 的榜单信息也给了一个更具体的对照坐标。IT之家援引页面显示,Qwen3.7 Max Preview 在文本综合排名第 13,并在数学第 7、专家级应用第 9、软件与 IT 第 9、编程第 10;在视觉榜单里,Qwen3.7 Plus Preview 综合排名第 16,另外在仅针对专家级提示的“专家竞技场”中,Qwen3.7 Max Preview 同样排名第 9。
如果你想验证这类预览模型的提升幅度,更省事的做法是准备一组固定的提示词:一组偏推理(数学 / 逻辑 / 约束推导),一组偏工程(需求理解 / 代码阅读 / 边界条件),用同一组样题在多个模型之间来回跑。工具能力没开放时,先把对比限定在文本能力上,结论会更清楚。