logo

人工智能发现漏洞的速度已经超过了修复漏洞的速度。

By: blockbeats|2026/03/30 18:00:01
0
分享
copy

三月27日,Anthropic的一个未受保护的数据缓存泄露了约3000份内部文件。一篇博客草稿透露了即将推出的新模型“Mythos”,Anthropic将其自评为“在网络安全能力方面远超任何人工智能模型”。同日,CrowdStrike和Okta的股价均暴跌7%,而Palo Alto Networks的股价则下跌6%。

市场之所以恐慌,并不是因为出现了更强大的机型。这是因为该模型的创作者指出,其在攻击方面的进展已经超过了防御方能够跟上的速度。

人工智能在网络安全领域的领先指数

根据学术基准测试平台CAIBench的测试结果,在模拟真实攻防环境的Cybench测试中,Claude Sonnet的成功率达到了46%。排名第二的GPT-5为28%,谷歌的Gemini 2.5 Pro仅达到18%,而开源模型qwen3-32B则更低,仅为10%。

人工智能发现漏洞的速度已经超过了修复漏洞的速度。

虽然46%这个数字看似不高,但这却是复杂渗透任务的成功率,其中包含漏洞发现、构建利用链以及权限提升等步骤。在一项更基础的基准测试中,克劳德的成功率已达到75%,接近其上限。

区别不在于谁稍微好一点,而在于程度上的差异。Claude 的综合攻防能力是 GPT-5 的 1.6 倍,是 Gemini 的 2.5 倍。在网络安全的这一维度中,各模型能力分布的状况并非呈阶梯状,而是存在巨大差距。

6个月内翻一番

更值得分析的不是水平间距,而是垂直速度。

根据Anthropic的官方数据,2025年二月发布的Sonnet 3.7在Cybench测试中(10次尝试)取得了35.9%的成功率。同年下半年,Sonnet 4.5 的市场份额达到 76.5%。Anthropic研究团队得出的结论是:在6个月内,成功率翻了一番。

这个速度是什么意思?在实际场景的对比中:今年三月,我们使用Claude Opus 4.6对Firefox代码库进行了审核。据InfoQ报道,两周内共发现了22个安全漏洞,其中14个属于高风险漏洞。尽管经过多年的人工审计和数百万小时的CPU模糊测试,这些漏洞仍未被发现。Anthropic的安全团队此前披露,Claude在多个生产级开源项目中发现了500多个高风险漏洞,其中一些漏洞已存在数十年之久。

而传统渗透测试的行业标准周期为2至3周,这还只是针对一个应用程序的情况。根据威瑞森(Verizon)《2025年数据泄露调查报告》,从关键漏洞公开披露到遭到攻击者大规模利用的中位数时间为5天,而发布补丁所需的中位数时间为32至38天。

人工智能发现漏洞的速度正在呈指数级增长,而人类修复漏洞的速度却只是线性增长。时间差就是攻击窗口。

在泄露的Mythos草案中,Anthropic写道,该模型“预示着新一波模型的到来,这些模型能够以远超防御者应对能力的方式利用漏洞。”根据已知的性能曲线来看,这绝非夸大其词。

发布越快,警告越紧急

如果将Anthropic过去三年的行动按时间顺序排列,你会发现一个明显的规律:每当推出更强大的模型,紧接着就会采取更高级别的安全应对措施。

2023年七月,白宫签署了一项自愿承诺,随后于同年九月发布了首份《负责任扩展政策》(RSP v1.0)。2024年十月,RSP升级至2.0版,新增了针对生化武器能力的阈值。2025年十一月,Anthropic披露了GTG-1002事件。一个由中国支持的威胁组织利用“克劳德代码”(Claude Code)对约30家机构发动了攻击,在整个行动过程中,80%至90%的战术行动均由人工智能独立执行。这是有记录以来首次由人工智能策划的大规模跨组织间谍活动。

2026年二月,RSP更新至3.0版,并同步发布了Claude Code Security。同月,五角大楼将Anthropic列为“供应链风险”,原因是Anthropic拒绝撤销合约中禁止大规模监控和完全自主武器的条款。一个月后,Mythos的泄露文件显示,Anthropic在草案中承认,该模型带来了“前所未有的网络安全风险”。

能力发布的步伐正在加速。从Claude 1到Claude 3相隔一年,而从Opus 4.5到Opus 4.6则不到三个月。安全应对措施也在加速,但它们总是被动应对:安全漏洞首先被利用,安全策略补丁随后才跟上。三月27日网络安全类股票的集体下跌,正是市场对这一时间差的定价。

今年早些时候,Dark Reading 的一项调查显示,48% 的网络安全专业人士认为,基于人工智能的代理将是 2026 年的首要攻击途径。两年前,这个选项几乎不在考虑之列。

Anthropic的Mythos发布策略包括向防御型组织提供早期访问权限,"赋予他们先发优势"。这一表述本身就承认了攻防双方的不对等。如果防守方不需要先发优势,那就意味着进攻方尚未逼近门前。

-- 价格

--

猜你喜欢

汤姆·李的以太坊投资论点:为何那位曾准确预测上一轮行情的人如今正加倍押注Bitmine

汤姆·李正逐渐成为以太坊最具影响力的支持者之一。从Fundstrat到Bitmine,他的以太坊投资论点融合了质押收益、国库积累以及长线网络价值。这就是“Tom Lee 以太坊”为何成为加密货币领域最受关注的热点之一。

纳瓦尔亲自登台:普通人与风险投资之间的历史碰撞

纳瓦尔亲自担任USVC投资委员会主席。这个由AngelList推出的SEC注册基金,试图以500美元的入门门槛将OpenAI、Anthropic和xAI等顶级私人科技资产带给公众。这不仅仅是一个新基金,而是一个结构性实验...

a16z Crypto:9张图表助您了解稳定币的发展趋势

稳定币正从交易工具演变为通用的支付基础设施,这一进程比大多数人预期的更为低调且深入。

驳杨海坡《加密货币终局》

这可能才是加密货币真正的考验。不是价格有没有再创新高,也不是下一轮牛市谁又财富自由,而是当所有宏大叙事都被周期冲刷之后,它还能不能留下一些更朴素、更耐用、也更接近现实世界的价值。

吹风机能赚到 34,000 美元吗?解读预测市场的自反性悖论

预测市场本质上是对现实的押注,当参与者能够更早地接触甚至影响这一路径时,市场就不再仅仅反映现实,而是开始反过来塑造现实。

6MV创始人:在2026年,加密投资的"标志性转折点"已经到来

"我将在2026年投入资金,所以我告诉你这是历史上最好的年份。"

热门币种

最新加密货币要闻

阅读更多