简体中文
关闭
AI新闻焦点

Claude Mythos Preview 完整详解

#AI新闻焦点 ·2026-04-15 10:32:36

IAICA.com.cn2026.4.15

 

AnthropicClaude AI的母公司)于202647-8日正式公布了旗下迄今最强大前沿模型——Claude Mythos Preview。这不是普通升级,而是被公司自己形容为“能力跃升”的下一代通用大模型,却因网络安全风险极高而拒绝公开发布,直接引发全球AI与网络安全圈“AI末日”级讨论。1. 它到底有多强?通用能力全面领先:在SWE-bench(软件工程)、数学奥赛、代理编码等基准测试中大幅超越前代Claude Opus 4.6,是Anthropic目前“最强大模型”。

网络安全能力“惊人”:自主发现并利用数千个零日漏洞(zero-day),覆盖所有主流操作系统(WindowsmacOSLinux等) 和 所有主流浏览器。部分漏洞存在27年(OpenBSD)、16年(FFmpeg),人类+自动化工具多年未发现。

模型可在无人工引导下完成漏洞发现 → 编写exploit → 链式攻击。

英国AI安全研究所(AISI)独立验证:在CTF式网络攻防测试中,达到“专家级”73%成功率,甚至能在模拟企业网络中实现完全接管。

 

Anthropic官方红队博客和系统卡(System Card)公开了部分技术细节和已修复漏洞示例,证明这些能力真实存在,而非营销噱头。2. 为什么Anthropic“不敢”公开发布?Anthropic评估后得出结论:Mythos Preview的编码+推理能力已达到能“超人类”发现并利用软件漏洞的水平。如果落入恶意黑客或国家行为者手中,可能瞬间引发大规模网络攻击,威胁关键基础设施(银行、医疗、能源、互联网等)。这是Anthropic首次主动限制前沿模型公开发布。

系统卡明确写道:“能力大幅提升导致我们决定不做一般可用(general availability)。”

 

3. 他们做了什么?——Project Glasswing计划Anthropic立刻推出Project Glasswing(玻璃翼计划),把Mythos Preview的访问权限仅限给少数战略伙伴,用于防御性网络安全:参与方包括:AWSAppleBroadcomCiscoCrowdStrikeGoogleJPMorgan ChaseMicrosoftNvidiaPalo Alto NetworksLinux Foundation40多家科技巨头和开源组织。

目标:在攻击者获得同等AI能力前,抢先修复全球关键软件的漏洞,给防御方争取3-6个月窗口期。

Anthropic额外投入1亿美元AI使用额度 + 400万美元直接捐赠给开源安全项目。

部分企业已通过Google Cloud Vertex AI获得私有预览访问。

 

4. 当前最新进展(截至2026.4.14)模型仍处于严格受控状态,仅限Project Glasswing成员使用。

官方已发布详细系统卡(300+页)和红队报告,透明度较高。

媒体反应两极:乐观者认为这是AI守护网络安全”的里程碑;担忧者警告“AI超级黑客时代”已来,呼吁全球监管跟上。

部分开源项目已在Mythos帮助下紧急打补丁,但仍有大量漏洞待修复。

 

一句话总结:Claude Mythos PreviewAI能力突破的标志性事件——它证明前沿模型已能“自主重塑网络安全格局”。Anthropic选择把这把“双刃剑”先交给防御方,而不是放给全世界,这或许是2026AI安全史上最重要的决定之一。

相关标签:

分享本文

Copyright © 2026 IAICA 版权所有  隐私政策 用户协议 Cookie说明 备案号:沪ICP备11018632号-8

021-51699291