GPT-5驱动的Aardvark:92%漏洞命中率,开启AI安全自动化新纪元

OpenAI近日推出了名为Aardvark的自主安全研究智能体,该智能体由GPT-5驱动,旨在自动发现并修复软件代码中的安全漏洞。

GPT-5驱动的Aardvark:92%漏洞命中率,开启AI安全自动化新纪元

目前,Aardvark处于beta测试阶段。OpenAI将其定位为一种“防御者优先”的新范式,能够随代码库的演化为开发团队提供持续的保护。

根据OpenAI披露的数据,在标准代码库的基准测试中,Aardvark对已知漏洞与人工植入漏洞的识别率达到了92%。它通过早期漏洞捕捉、利用验证及提供清晰的修复方案,旨在强化安全体系的同时,不拖慢开发创新的节奏。

Aardvark的名字来源于夜行性的非洲食蚁兽,其独居并以蚂蚁和白蚁为食的特性,被巧妙地类比为该智能体异步、独立地“吞噬”程序漏洞(Bug)的工作方式。

GPT-5驱动的Aardvark:92%漏洞命中率,开启AI安全自动化新纪元
GPT-5驱动的Aardvark:92%漏洞命中率,开启AI安全自动化新纪元

Aardvark的工作原理

Aardvark通过持续监控源代码仓库的提交与变更来工作。其核心是利用大语言模型的推理能力和工具调用功能,深入理解代码行为并定位漏洞,而非依赖传统的模糊测试或软件成分分析技术。

其工作流程分为四个主要阶段:

  1. 分析阶段:对完整代码库进行全面分析,生成反映项目安全目标与架构设计的威胁模型。
  2. 提交扫描:实时比对代码变更与威胁模型,检测新增漏洞。首次接入仓库时,会扫描历史记录以识别现存问题,并提供带标注的代码解析。
  3. 验证阶段:在隔离的沙箱环境中尝试触发潜在漏洞,以确认其真实可利用性,从而确保分析结果的低误报率。
  4. 修复阶段:与OpenAI Codex协同,为已验证的漏洞生成修复补丁。这些补丁附在检测报告中,供开发人员审核后一键应用。
GPT-5驱动的Aardvark:92%漏洞命中率,开启AI安全自动化新纪元

AI作为生产力放大器

这一应用场景被业界认为极具潜力。寻找漏洞需要系统性的推理和上下文理解,这正是先进推理模型的强项。AI能够思考远超人类数量的边缘情况,从而发现容易被遗漏的漏洞。

GPT-5驱动的Aardvark:92%漏洞命中率,开启AI安全自动化新纪元

Aardvark被设计为与开发者协作的工具。它无缝集成到GitHub等现有工作流中,并在关键环节设置了人工审核步骤。安全工程师的角色并未被取代,而是转变为最终的质量把关者。这使其成为一种生产力放大器,而非替代品。

此前,已有研究探索AI自动化漏洞处理流程。例如,有安全研究人员搭建的系统能够自动分析CVE通告、生成测试应用与利用代码,并进行验证,实现了对每日上百条CVE信息的高效处理。

GPT-5驱动的Aardvark:92%漏洞命中率,开启AI安全自动化新纪元
GPT-5驱动的Aardvark:92%漏洞命中率,开启AI安全自动化新纪元

安全智能体的崛起背景

软件漏洞已成为系统性风险。据统计,仅2024年公开的通用漏洞披露(CVE)数量就超过4万例,年增长率高达38%。同时,高危的“零日漏洞”在黑市上的价格持续飙升。

GPT-5驱动的Aardvark:92%漏洞命中率,开启AI安全自动化新纪元
GPT-5驱动的Aardvark:92%漏洞命中率,开启AI安全自动化新纪元

传统漏洞发现手段(如模糊测试)费时费力,而AI在代码理解与推理上的突破,正使其成为应对海量漏洞挑战的关键力量。Aardvark的重要性体现在:

  • 弥补人力缺口:普通企业难以雇佣足够的安全专家。
  • 应对漏洞洪流:每年有数万新漏洞被公开。
  • 提供持续防护:能够7×24小时不间断地“巡逻”代码库。
  • 拓展检测范围:不仅能发现安全漏洞,还能识别逻辑错误或隐私风险。

Aardvark已在OpenAI内部及外部alpha合作伙伴中运行数月,成功发现了多个有实际意义的安全漏洞,并因其能识别复杂条件下的隐蔽问题而受到好评。

与此同时,谷歌DeepMind也于本月初发布了基于Gemini模型的AI智能体CodeMender,它能够自主调试并修复复杂漏洞,在修改前后进行深入推理与验证。

AI驱动的安全智能体,正在彻底改变网络安全的竞争格局。

参考资料:
https://deepmind.google/discover/blog/introducing-codemender-an-ai-agent-for-code-security/
https://substack.com/home/post/p-170458299
https://x.com/imxiaohu/status/1984061183301972339


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/13755

(0)
上一篇 2025年10月31日 下午12:34
下一篇 2025年11月1日 上午7:19

相关推荐

  • AI生成数据污染:医疗诊断可靠性的隐形杀手与破解之道

    随着生成式人工智能在医疗领域加速渗透,越来越多的病历、影像报告及各类临床文本正逐步纳入AI参与生成的范畴。这一旨在提升效率的技术革新背后,潜藏着威胁诊断安全性的深层隐患。 一项由新加坡国立大学、哈佛大学、斯坦福大学、耶鲁大学、谷歌及梅奥诊所等机构的跨学科团队完成的最新研究表明,当AI生成的临床文本被用作训练新一代AI模型时,一些罕见但关键的病理信息会在数据迭…

    2天前
    7800
  • 南京大学联合美团、上交推出RunawayEvil:首个I2V自进化越狱框架,破解视频生成模型安全漏洞

    来自南京大学 PRLab 的王淞平、钱儒凡,在单彩峰教授与吕月明助理教授的联合指导下,提出了首个面向图生视频(I2V)模型的多模态自进化越狱攻击框架 RunawayEvil。该研究联合了美团、上海交通大学等多家机构,共同完成了首个支持多模态协同与自主进化的 I2V 越狱攻击框架的研发。 RunawayEvil 创新性地采用「策略 – 战术 &#8…

    2025年12月25日
    17900
  • 小冰之父李笛团队推出“卫士虾”:不到10k文件,专防Agent安全漏洞

    小冰之父李笛团队发布“卫士虾”:不足10k文件,专防Agent安全漏洞 随着智能体(Agent)应用日益广泛,其安全问题也引发关注。近期,已有国家级机构发布安全风险提示,甚至有企业明令禁止在公司设备上使用相关应用。认证绕过、命令注入、API密钥泄露、提示词攻击等风险层出不穷。 现在,一个不足10KB的文件声称能有效堵上这些安全漏洞。 近日,由“小冰之父”李笛…

    5天前
    17900
  • Claude Opus 4.6两周挖出Firefox 14个高危漏洞,AI安全攻防进入新纪元

    近日,Anthropic 公布了一项与 Mozilla 的合作测试结果,其模型 Claude Opus 4.6 在两周内,于 Firefox 浏览器代码库中发现了 22 个不同的漏洞,其中 14 个被归类为“高危漏洞”。这一数量几乎相当于 Mozilla 在 2025 年修复的全部高危漏洞的五分之一。 这一结果清晰地表明,AI 正以前所未有的速度辅助人类识别…

    2026年3月7日
    10300
  • Anthropic突破性技术:参数隔离实现AI危险能力精准移除,无需数据过滤

    近年来,大语言模型的能力突飞猛进,但随之而来的却是愈发棘手的双重用途风险。当模型在海量公开互联网数据中学习时,它不仅掌握语言与推理能力,也不可避免地接触到 CBRN(化学、生物、放射、核)危险制造、软件漏洞利用等高敏感度、潜在危险的知识领域。 为此,研究者通常会在后训练阶段加入拒答机制等安全措施,希望阻断这些能力的滥用。然而事实证明,面对刻意规避的攻击者,这…

    2025年12月20日
    17800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注