Anthropic 公布 Claude Mythos Preview 网络安全评估,漏洞研究能力继续前移
2026 年 4 月 7 日,Anthropic 公布 Claude Mythos Preview 的网络安全能力评估,并发布技术说明。按官方披露,这个预览模型已经能在部分场景下把漏洞发现继续推进到验证和利用链构造。

公开材料提到,Mythos Preview 在测试中针对主流操作系统、浏览器和常见基础组件发现并利用 zero-day 漏洞,例子包括后续已修补的 OpenBSD 漏洞、FFmpeg 漏洞,以及浏览器、内核和文件系统服务上的 exploit 尝试。
Anthropic 还强调,这轮评估大量放在真实软件环境里完成。官方说明里提到,会用多个 agent 分别扫描不同入口,再安排复核 agent 过滤重复发现和低质量误报;在 198 份人工复核报告里,模型给出的严重性判断有较高一致性。
由于大部分问题还没有完成修补,Anthropic 没有公开过多 exploit 细节,也表示 Mythos Preview 不会直接面向公众开放。同时公司启动了 Project Glasswing,希望优先把这类能力用在关键软件和基础设施的防守上。
这类评估把讨论从“模型会不会写恶意代码”往前推了一步,开始直接落到真实漏洞研究和防守流程。