解析首个 AI 编写的零日漏洞：Google 如何拦截 2FA 绕过及其对 LLM 安全栈的启示

理论上的 AI 风险与现实操作之间的界限已经正式消失。最近，一个 AI 系统自主组装了一个功能完备的零日漏洞（Zero-Day Exploit），旨在绕过某开源管理工具的双重身份验证（2FA）。虽然这次尝试最终被 Google 级的高级检测流水线拦截，但这一事件成为了网络安全行业的一个分水岭。我们不再仅仅是在应对 AI 辅助的钓鱼攻击；我们正在进入“AI 原生对手”的时代。

对于使用 n1n.ai 等平台集成大语言模型（LLM）的开发者和安全团队来说，这一转变要求我们对安全栈进行根本性的重新评估。将 LLM 视为被动工具已不再足够；必须将其视为能够以机器速度发现并链接漏洞的潜在“操作员”。

三大趋势：AI 驱动的进攻端演进

这次 2FA 绕过事件凸显了正在重塑威胁格局的三个核心趋势：

国家级力量的武器化：据观察，Forest Blizzard 和 Salmon Typhoon 等高级持续性威胁（APT）组织已经开始利用公共 LLM 进行侦察和复杂的脚本编写。他们利用模型查询技术栈细节和卫星数据，以精细化其攻击目标。
自主漏洞链构建：Anthropic 的 Mythos Preview 等模型已展示出摄取海量代码库、识别数千个潜在漏洞并自主将其串联成高影响攻击（如浏览器沙箱逃逸）的能力。
AI 原生恶意软件与 C2 转向：现代恶意软件研究表明，攻击手段正转向嵌入式 LLM 驱动的自修改代码，并利用 AI 助手作为隐蔽的命令与控制（C2）通道，将恶意流量伪装成正常的 API 调用。

为了保持领先，开发者需要获取最先进的模型进行红队测试。n1n.ai 提供了通往这些高推理模型的统一门户，允许安全团队在漏洞被野外利用之前，模拟这些确切的攻击向量。

AI 编写 2FA 绕过漏洞的深度拆解

AI 究竟是如何“编写”零日漏洞的？其工作流程极其系统化，将人类数周的研究压缩到了几分钟之内：

第一阶段：自动化摄取与映射

攻击者将目标的开源仓库或二进制文件输入 LLM。模型会映射身份验证中间件，识别令牌（Token）是如何发放的、2FA 挑战是如何触发的，以及会话（Session）是如何持久化的。它会寻找逻辑漏洞，例如 2FA 令牌是否仅绑定到会话 ID 而非特定的用户身份。

第二阶段：漏洞假设生成

AI 会列举潜在的绕过路径，并可能提出以下假设：

令牌重用：2FA 代码是否可以在短时间内多次使用？
“记住设备”逻辑缺陷：设备 Cookie 是否容易被猜测或转移？
验证端点的 CSRF：是否可以通过针对验证端点的跨站请求伪装攻击来跳过 2FA 检查？

第三阶段：漏洞原语合成 (Exploit Primitive Synthesis)

正如 DeepSeek-V3 或 Claude 3.5 Sonnet 能够处理复杂的编码任务一样，攻击型 AI 会合成“原语”——即针对特定漏洞的小段代码。然后它将这些原语串联起来。例如，它可能利用会话固定（Session Fixation）漏洞设置一个已知的会话 ID，然后触发一个错误地针对该固定会话进行验证的 2FA 流程。

第四阶段：有效载荷迭代与逃逸

如果 Web 应用防火墙（WAF）拦截了第一次尝试，AI 不会停止。它会变异有效载荷（Payload），调整请求头、时序和编码，直到绕过成功。这种持续演进的速度远超传统基于签名的 SIEM（安全信息和事件管理）系统的更新频率。

防御端的进化：LLM 增强型 SIEM 与 UEBA

拦截 AI 攻击者需要一个以同样速度运行的防御系统。Google 级的检测栈现在正将 LLM 直接集成到其 SIEM 和 UEBA（用户与实体行为分析）流水线中。

功能特性	传统 SIEM	LLM 增强型 SIEM
检测方法	静态规则与签名	行为基准与 LLM 推理
响应速度	被动响应（事后）	近乎实时（预测性）
上下文理解	仅限于日志字符串	深度理解意图与 TTPs
处理方式	人工分诊	自动化假设与规则草拟

在 2FA 绕过案例中，检测系统标记了与典型用户浏览器指纹不匹配的异常令牌发放模式。随后，LLM 层对这些告警进行了总结，识别出被攻击的具体 2FA 流程，并建议对可疑的管理操作实施临时拦截。

保护您的 LLM 安全栈

当您通过 n1n.ai 构建应用时，您自己的 AI 栈也会成为高价值目标。一个权限控制不当、拥有管理 API 访问权限的 Agent，本质上就是一个预装的后门。为了降低风险，请参考以下“专家建议”：

提示词清理 (Prompt Sanitization)：在输入到达核心逻辑之前，使用专门的“安全”模型过滤掉用户输入中的 Jailbreak（越狱）模式。
工具调用白名单：绝不要让 LLM 直接访问“重置 2FA”或“删除用户”等高危 API。必须引入中间验证步骤，由人工或硬编码逻辑进行二次确认。
精细化 RBAC：确保您的 LLM Agent 所使用的 API Key 仅拥有所需的最小权限。如果 Agent 只需要读取日志，切勿赋予其数据库写入权限。
出站流量监控：监控 LLM Agent 是否发起了异常的网络抓取请求。这通常是 Agent 被用作 C2 中继的信号。

工程师实施路线图

红队化您的代码：利用 n1n.ai 上提供的高推理模型审计您的身份验证逻辑。向模型提问：“在这段中间件代码中找出三种绕过 2FA 的方法。”
增强分析能力：将身份验证日志输入 UEBA 系统，并利用 LLM 总结异常。重点关注 2FA 注册过程中的“异地登录”现象。
加固 Agent 层：将每一个 Agent 视为不可信用户。使用 LangChain 或类似框架在工具调用周围实现严格的防护栏（Guardrails）。

总结

全球首个 AI 编写的零日漏洞并非恐慌的理由，而是对精准防御的召唤。赋能这些攻击的技术——先进的 LLM——同样也是让我们能够抵御它们的武器。通过将来自 n1n.ai 的高速、可靠 API 集成到您的安全运营中，您可以构建一个随威胁共同演进的深度防御策略。

立即在 n1n.ai 获取免费 API 密钥。

参考来源：https://dev.to/olivier-coreprose/inside-the-first-ai-crafted-zero-day-how-google-blocked-a-2fa-bypass-and-what-it-means-for-your-ko3