重大消息：国产AI在漏洞检测能力上或逼近 Claude Mythos 级别？

作者：championsky | 发布时间：2026-06-28 15:34:55

据外媒部分媒体及行业分析报道，中国智谱 AI 在软件漏洞发现能力方面取得新进展，其最新模型 GLM-5.2 在某些测试场景中，被认为可能已接近甚至在性价比层面挑战 Anthropic Claude Mythos 级别的漏洞检测能力。

报道指出，该模型在企业级安全测试任务中展现出较强的代码理解与漏洞识别能力，并且在推理成本上显著低于同类高端闭源模型，可能仅为其约四分之一成本。

如果该结果在更广泛、独立评测中得到验证，这意味着国产大模型在“AI安全审计 / 自动化漏洞挖掘”方向上，正在快速缩小与国际顶尖模型之间的差距，并开始在企业安全市场形成直接竞争。

不过目前相关结论主要仍基于特定测试环境与有限披露信息，仍需更多第三方验证。

网络安全视角独立分析

从专业角度，这类消息需要拆成三层来看：

所谓“AI发现漏洞”，通常并不是像人类红队那样真正理解系统攻击面，而更多是：

👉 所以它更接近：

“高级自动化 SAST + 语言模型推理增强”，而不是“真正自主安全研究员”

“Claude Mythos级别”如果作为 benchmark，需要谨慎看待：

👉 很多“接近/超越”的结论，本质上是：

在特定测试集上表现接近，而非全场景能力等价

如果报道中“成本仅 1/4”成立，这一点反而更重要：

👉 关键变化不是“谁更强”
而是：

“漏洞检测的边际成本正在塌缩”

如果这一趋势成立，会带来三个方向变化：

（1）红队/安全测试自动化增强

（2）灰盒/白盒测试门槛下降

（3）攻击面扩大（反作用）

👉 安全能力会进入“AI军备竞赛阶段”

这类进展即使部分属实，其核心意义不在“是否超越 Claude”，而在于：

AI 正在把漏洞挖掘从“专家驱动”变成“规模化计算问题”，网络安全行业的成本结构正在被重写。

标签：人工智能, Claude Mythos, 通用人工智能