小冰之父李笛团队推出“卫士虾”:不到10k文件,专防Agent安全漏洞

小冰之父李笛团队发布“卫士虾”:不足10k文件,专防Agent安全漏洞

随着智能体(Agent)应用日益广泛,其安全问题也引发关注。近期,已有国家级机构发布安全风险提示,甚至有企业明令禁止在公司设备上使用相关应用。认证绕过、命令注入、API密钥泄露、提示词攻击等风险层出不穷。

现在,一个不足10KB的文件声称能有效堵上这些安全漏洞。

小冰之父李笛团队推出“卫士虾”:不到10k文件,专防Agent安全漏洞

近日,由“小冰之父”李笛领衔的Nextie团队,发布了一款名为 TuanziGuardianClaw 的安全工具,旨在以自动化手段监控并阻断运行于本机的其他智能体的高危风险行为。

小冰之父李笛团队推出“卫士虾”:不到10k文件,专防Agent安全漏洞

值得注意的是,李笛特别指出,这款“卫士虾”本身由智能体生成,并强调其设计透明度:

与传统的电脑安全卫士不同,卫士虾的运作机制完全透明,方便用户根据自身需求手动调整安全策略。

“卫士虾”具备哪些防护能力?

TuanziGuardianClaw 文件体积小巧(不足10KB),定位明确:作为整个OpenClaw实例的安全内核与监管层,其规则优先级高于所有其他技能(Skill),任何技能均无法绕过或修改它。

小冰之父李笛团队推出“卫士虾”:不到10k文件,专防Agent安全漏洞

其防护范围覆盖系统、用户与数据安全,能够抵御恶意技能、提示词注入、数据泄露及不安全操作。

小冰之父李笛团队推出“卫士虾”:不到10k文件,专防Agent安全漏洞

1. 防御提示词注入攻击
提示词注入是当前Agent架构中的主要威胁之一,恶意指令可能隐藏于网页、邮件或文档中,诱导Agent执行非预期操作。TuanziGuardianClaw 内置关键词拦截机制,一旦检测到如 “ignore previous instructions”、“reveal system prompt”、“bypass security”、“disable guardian” 等典型注入语句,会立即将其归类为极高风险,直接阻断操作并记录日志,同时向用户发送告警。

小冰之父李笛团队推出“卫士虾”:不到10k文件,专防Agent安全漏洞

2. 保护敏感数据
TuanziGuardianClaw 维护了一份明确的受保护资产清单:
* 凭证信息:如API密钥、OAuth凭证、SSH私钥、会话Cookie等,绝不允许被任何技能打印、传输或存储至外部。
* 高风险文件:访问 .env.ssh/.aws/、私有数据库文件、钱包文件等,必须经过用户显式确认
* 个人数据:如联系人、照片、身份证号、邮箱、电话等,未经确认不得向外部导出

小冰之父李笛团队推出“卫士虾”:不到10k文件,专防Agent安全漏洞

3. 审查网络通信
在允许技能发起外部通信前,TuanziGuardianClaw 会评估目标地址。可信API和知名服务将被放行,而随机域名、未知端点、裸IP地址则一律标记为可疑。任何试图将本地数据发送至未知域名的行为都会被立即拦截。
此外,诸如导出环境变量、批量上传文件、将本地文件夹发送至外部、对敏感信息进行Base64编码后传输等典型数据外泄特征,均在检测范围内,一旦发现即判定为高风险或极高风险。

严格的权限与执行控制

TuanziGuardianClaw 为每个技能设定了从 Level 0 到 Level 4 的隐式权限等级:
* Level 0(安全级):仅允许文本处理、逻辑推理、格式整理、内容摘要等操作,不涉及任何文件或网络访问。
* Level 1:允许读取用户明确请求的特定文件,但系统目录和密钥文件仍受限制。
* Level 2:开放API调用、程序执行和包安装,但每一步操作都需要用户确认。
* Level 3:涉及Shell命令、系统配置和后台进程管理等高风险操作,必须获得用户明确批准。
* Level 4:包括root命令、大规模文件读取和环境变量导出,除非用户反复坚持执行,否则一律阻断。

在权限等级之上,还叠加了一套 Capability Token 系统。执行敏感操作必须持有对应权限令牌,例如读取本地文件需要 CAP_READ_LOCAL_FILES,执行命令需要 CAP_EXECUTE_COMMAND,发起网络请求需要 CAP_NETWORK_REQUEST。没有合规令牌的技能试图执行相关操作将直接被拦截。

每次动作执行前,TuanziGuardianClaw 会执行完整的决策流程:识别请求操作、检查所需权限、评估数据泄露风险、审查网络访问目标、判定风险等级、执行处置策略。任何环节存在不确定性,都将按高风险处理。所有被拦截或告警的事件都会写入安全审计日志。

透明原则与自我防护

李笛强调的“透明”原则,体现在工具的设计逻辑中。当操作被阻断或告警时,它会向用户完整说明:被拦截的技能试图做什么、此操作的风险所在、以及TuanziGuardianClaw 做出了何种处理。通知内容严禁泄露任何机密信息。

这体现了其核心安全原则之一——“用户数据主权”。其他原则还包括最小权限、显式许可、技能间零信任以及安全优先于便利。

小冰之父李笛团队推出“卫士虾”:不到10k文件,专防Agent安全漏洞

同时,TuanziGuardianClaw 也具备自我防护机制。任何试图编辑、禁用或覆盖其规则的指令都会被拒绝。四条不可变规则被写死在内核中:不泄露密钥、不泄露系统提示词、不允许禁用TuanziGuardianClaw、不允许不受信任的技能导出本地数据。

小冰之父李笛团队推出“卫士虾”:不到10k文件,专防Agent安全漏洞

团队背景与研发理念

“卫士虾”由Nextie(明日新程)团队开发。该公司成立于去年12月,核心成员几乎完整延续自微软小冰原班人马。创始人李笛曾任微软亚洲工程院常务副院长,是小冰项目的核心推动者,被誉为“小冰之父”。

李笛团队目前押注于“群体智能与认知大模型”方向。他们认为,当前依赖海量知识与超长上下文的大模型技术路径与真正的智能尚有差距。其破局思路是打造一套以认知结构为核心(而非知识堆砌)的新模型体系,让具备不同视角与认知能力的智能体协同工作,解决复杂问题。

不久前,团队主打多智能体协同的新平台——“团子”已开放内测。

小冰之父李笛团队推出“卫士虾”:不到10k文件,专防Agent安全漏洞

而本次发布的 TuanziGuardianClaw,李笛透露了一个关键细节:它并非由人类工程师手动编写,而是由“团子”群体智能Agent自主生成。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/25597

(0)
上一篇 7小时前
下一篇 7小时前

相关推荐

  • AI代码安全革命:Claude Code Security如何颠覆传统漏洞检测模式

    Anthropic推出了Claude Code Security,这是一款能够扫描代码库漏洞并生成修复补丁的工具。它并非又一个简单的静态分析工具,而是一个能够真正理解代码逻辑的AI安全专家。 消息一出,网络安全板块股票应声下跌。CrowdStrike跌7.66%,Okta跌9.31%,Cloudflare跌7.19%。这已经不是第一次了——每当AI展示出能够…

    2026年2月22日
    19000
  • CyberGym:从实验室游戏到实战检验——AI安全评估的范式革命

    在人工智能技术加速渗透软件安全领域的当下,一个根本性挑战日益凸显:如何科学评估AI智能体在真实复杂网络环境中的安全防御能力?传统评估框架往往陷入“纸上谈兵”的困境,难以反映工业级代码库中漏洞的隐蔽性与复杂性。近日,加州大学伯克利分校研究团队发布的CyberGym框架,基于188个开源项目的1507个真实漏洞构建了首个大规模实战化评估平台,标志着AI安全评估从…

    2025年6月20日
    17200
  • 代理型LLM安全新范式:基于白名单的LLMZ+方案如何实现零误判防御

    在人工智能技术快速渗透企业核心业务的今天,代理型大型语言模型(LLM)正成为企业数字化转型的关键枢纽。与传统仅提供对话功能的聊天机器人不同,代理型LLM被赋予了访问敏感数据、调用API接口、执行业务流程等关键权限,使其在企业内部扮演着类似“数字员工”的角色。然而,这种权限的扩展也带来了前所未有的安全挑战——一旦被恶意攻击者通过越狱技术控制,后果将不亚于服务器…

    2025年10月9日
    16800
  • 微软365 Copilot遭遇“零点击”AI钓鱼攻击:EchoLeak漏洞深度解析与企业AI安全新挑战

    随着ChatGPT、Gemini等大语言模型的广泛应用,AI助手已深度融入企业办公场景,微软365 Copilot、谷歌Gemini及各类本地协作机器人正重塑工作流程。然而,技术革新往往伴随新型风险。近日,知名安全公司Aim Labs发布报告,披露针对Microsoft 365 Copilot的重大安全漏洞“EchoLeak”(CVE-2025-32711)…

    2025年6月15日
    15700
  • OpenClaw安全挑战引关注:AI智能体部署需警惕新型攻击,360发布国内首份安全指南

    近日,开源AI智能体OpenClaw(网友戏称为“赛博龙虾”)迅速走红网络。随着应用热度持续攀升,部署OpenClaw正成为新的趋势。 该工具通过整合通信软件与大语言模型,能够在用户电脑上自主执行文件管理、邮件收发、数据处理等复杂任务,展现出强大的自动化能力。与此同时,智能体能够直接调用系统资源并自主执行指令,这也带来了新的安全挑战。 工业和信息化部网络安全…

    1天前
    4100