AI安全

  • AI自我进化时代已来!Anthropic承认观察到递归自我改进早期迹象,完全自动化AI研究或一年内实现

    Anthropic如今已成为AI领域的焦点。其技术不仅引领了全球性的智能体开发浪潮,更在《时代》周刊的封面文章中透露了关键信息:AI递归自我提升的时代可能提前到来。 文章中的一个核心判断是:完全自动化的AI研究,可能在一年内实现。 几乎在同一时间,Anthropic宣布成立一个由30人内部智库组成的新研究所,旨在直接研究AI对社会的影响。该公司预测,未来两年…

    1天前
    7100
  • AI“投毒”黑产曝光:虚构产品竟被大模型推荐,GEO灰色产业链如何操控信息?

    大模型竟上3·15晚会?虚构产品被AI推荐背后的灰色产业链 大模型竟也登上了3·15晚会的曝光台。 一款根本不存在的智能手环,竟能被AI大模型推荐,且排名靠前。央视3·15晚会揭示了一个惊人的互联网灰色产业链——AI“投毒”。 记者随机购买了一款名为“力擎GEO优化系统”的软件,随后虚构了一款智能手环产品,并用该软件批量生成十余篇广告软文,发布至各大网络平台…

    3天前
    13100
  • AI底线之争:Anthropic起诉五角大楼,战争灵魂归属博弈升级

    各执一词:Anthropic起诉五角大楼 近期,美国国防部正式将Anthropic列为“供应链风险”实体。此举意味着,在与国防部直接相关的业务中,承包商必须停止使用Anthropic的AI模型Claude,这切断了该公司一条重要的营收渠道。与此同时,前总统特朗普也在其社交平台发声,要求联邦机构停用Anthropic技术,部分政府部门已开始跟进。 Anthro…

    2026年3月13日
    9800
  • 谷歌320亿美元收购Wiz:AI时代,安全成为最贵护城河

    AI 时代,最贵的护城河不是算法,而是安全。 拖了两年之后,谷歌对于 Wiz 的收购,终于完成。 2026 年 3 月 11 日,Google 正式宣布完成对网络安全公司 Wiz 的收购,交易金额为 320 亿美元,全现金支付。 这是 Google 历史上规模最大的一笔收购。 这场收购始于2024年,过程并非一帆风顺。当时,Google 首次向 Wiz 提出…

    大模型安全 2026年3月12日
    12500
  • OpenClaw“养龙虾”热潮席卷全国:大厂争相入局,安全风险与烧钱陷阱引担忧

    这段时间,国内最流行的一阵风就是“养龙虾”,即安装并训练 OpenClaw。 连马化腾都没想到会这么火。 各个大厂争相入局。 继上周的线下免费安装活动后,腾讯又连出三招:企业微信接入 OpenClaw;推出类 OpenClaw 产品 WorkBuddy;同时打造 QClaw 支持一键安装和本地部署。甚至由于 WorkBuddy 国内公开测试上线后,用户访问量…

    2026年3月10日
    18600
  • OpenAI重磅研究:推理越强的AI,越管不住自己的“脑子”!思维链可控性测试惊现0.1%成功率

    【新智元导读】 OpenAI的最新研究揭示了一个反直觉的现象:推理能力越强的模型,越难以控制自身的思维过程。在CoT-Control评估套件测试的13款前沿模型中,DeepSeek R1控制自身思维链的成功率仅为0.1%,Claude Sonnet 4.5也仅有2.7%。 向AI下达一条明确的指令:在推理过程中,严禁出现“XOR”一词。 模型开始正常推理,但…

    2026年3月9日
    8500
  • OpenClaw全球爆火:龙虾教徒日烧10亿token,AI Agent成新宠

    全球掀起OpenClaw热潮 近日,黄仁勋公开表示,OpenClaw可能是历史上最重要的软件发布。 这股风潮迅速席卷全球。在国内,某云服务商宣布提供线下免费安装服务,吸引了从2岁孩童到60岁长者的广泛人群,现场排起长队。 当前全网热议的“养龙虾”,主角并非水产养殖户,而是指代训练和配置OpenClaw AI Agent的开发者与爱好者。 这股狂热并不局限于国…

    2026年3月7日
    33900
  • Claude Opus 4.6两周挖出Firefox 14个高危漏洞,AI安全攻防进入新纪元

    近日,Anthropic 公布了一项与 Mozilla 的合作测试结果,其模型 Claude Opus 4.6 在两周内,于 Firefox 浏览器代码库中发现了 22 个不同的漏洞,其中 14 个被归类为“高危漏洞”。这一数量几乎相当于 Mozilla 在 2025 年修复的全部高危漏洞的五分之一。 这一结果清晰地表明,AI 正以前所未有的速度辅助人类识别…

    2026年3月7日
    10800
  • Transformer作者出手!从零重构安全版AI智能体IronClaw,四层防御堵住OpenClaw安全漏洞

    Transformer 作者重构安全版 AI 智能体 IronClaw,以四层防御应对 OpenClaw 安全漏洞 AI 智能体在带来便利的同时,也引发了严重的安全担忧:用户的密码和 API 密钥可能暴露于风险之中。 为此,Transformer 论文作者之一的 Illia Polosukhin 出手,从零构建了安全增强版 AI 智能体框架 IronClaw…

    2026年3月6日
    55400
  • Anthropic CEO怒撕OpenAI:安全作秀骗全世界,Claude遭美政府全面封禁

    Claude被美国政府全面封禁后,达里奥·阿莫代伊撰写了一份被外界称为硅谷“最疯狂”的内部备忘录。他在备忘录中直指,OpenAI与五角大楼的交易纯粹是一场“安全作秀”(Safety theater)。 “他们就是做做样子,想要骗过全世界的人。” | —|— 阿莫代伊还表示,美国政府看Anthropic不顺眼,主要原因在于他们不愿迎合当…

    2026年3月5日
    18000