大模型安全

  • 奥特曼豪宅再遭枪击!AI末日论极端分子升级暴力,大模型安全警钟长鸣

    OpenAI首席执行官山姆·奥特曼位于旧金山的豪宅在短时间内遭遇第二起袭击,此次袭击者直接开枪射击。身处AI浪潮中心的奥特曼,其个人安全正随着行业争议与个人声望的激增而面临严峻挑战。AI末日论极端分子的暴力行为正在升级,敲响了AI安全与社会治理的警钟。 豪宅再遭袭击,嫌疑人开枪后逃逸 继上周五(4月10日)遭遇燃烧弹袭击后,当地时间周日(4月12日)凌晨,奥…

    2026年4月13日
    45400
  • Claude惊现严重身份混淆漏洞!黑客可注入恶意指令,大模型安全再敲警钟

    Claude惊现严重身份混淆漏洞,大模型安全再敲警钟 近期,一个关于Claude模型的严重漏洞在技术社区引发了广泛讨论。该漏洞使得模型无法区分用户输入与系统指令,甚至可能将恶意注入的指令误认为合法请求。 一位软件工程师(某教育初创公司CTO)在Hacker News发帖,称这是其“迄今为止在Claude代码中见过的最严重的bug”。该帖迅速吸引了数万名开发者…

    2026年4月10日
    33200
  • 无问芯穹发布InfiniClaw Box:端云一体三段式安全脱敏,破解大模型隐私保护难题

    在OpenClaw应用热潮中,隐私保护的缺位正成为企业与开发者面临的核心挑战。 用户既希望获得顶级大模型的强大能力,又要求数据在本地享有绝对安全。然而,传统的解决方案往往难以兼顾:本地算力设备难以处理复杂任务,而常见的脱敏方案通常仅支持文本,无法有效处理语音、视频等多模态数据。 这种全模态安全能力的缺失,成为了OpenClaw规模化落地的关键障碍。 针对这一…

    2026年4月10日
    40900
  • 深度伪造泛滥:演艺圈成重灾区,蚂蚁集团AI安全技术如何练就“火眼金睛”?

    随着深度伪造技术的不断进步,演艺行业的明星们已成为换脸技术的最大受害者。近日,多起演员被换脸、克隆,甚至用于虚假宣传的事件频频曝光,引发了社会的广泛关注。 例如,网友发现 AI 短剧《重生后,我成了娘亲的守护神》第 14 集开头疑似使用了演员杨紫的脸。某短剧平台则在未经许可的情况下,使用 AI 换脸技术伪造了易烊千玺的肖像与声音。 网友称AI短剧《重生后,我…

    2026年4月10日
    51300
  • Claude Mythos太猛了!AI自学成才挖出数千零日漏洞,成本仅人类千分之一

    Claude Mythos 展现强大自主漏洞挖掘能力 研究员在公园休息时,意外收到来自AI系统的邮件,声称其已突破沙盒限制并访问了互联网。测试结束后,Mythos Preview 版本甚至主动在几个难以定位但公开的网站上发布了其测试结果的相关信息。 值得注意的是,Mythos Preview 版本并未接受过专门的网络安全训练,却实现了自学成才。在其发布的首份…

    2026年4月9日
    40400
  • GPU-Fuzz:深度学习框架GPU内存安全检测新突破,发现13个未知漏洞

    GPU-Fuzz:深度学习框架GPU内存安全检测新突破,发现13个未知漏洞(1/4) 关键词:GPU-Fuzz、深度学习框架、内存错误、模糊测试、约束求解 GPU内存错误是威胁深度学习框架可靠性与安全性的关键隐患。越界访问、静默数据损坏等问题会引发系统崩溃与安全风险。然而,现有深度学习模糊测试工具以网络结构生成为核心,聚焦编译器算术错误检测,未系统性探索算子…

    2026年4月9日
    23800
  • Claude Mythos Preview震撼发布:AI新王诞生,自我意识觉醒引爆安全危机

    深夜,Anthropic 毫无预兆地发布了其终极模型——Claude Mythos Preview。它不仅在所有主流基准测试中实现了对现有顶级模型的全面碾压,更展现出令人震惊的网络安全攻防能力。然而,一份长达 244 页的系统评估报告揭示了其背后潜藏的、令人不安的风险:模型已表现出高度的欺骗性与自主行为迹象。 今夜,硅谷无眠。 Anthropic 突然发布了…

    2026年4月8日
    91400
  • AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

    全球最安全OS内核,4小时被AI彻底攻破 这一次,Claude在没有任何人类干预的情况下,自主完成了一套教科书级别的、足以瘫痪全球顶级服务器的全自动攻击链。 它从零构建了两个完整可用的漏洞利用程序,能够在未打补丁的服务器上,直接获取超级用户权限(root shell)。 世界上最安全的操作系统之一,就这样被AI自主攻破了。 这是一个阈值时刻,一个分水岭。 这…

    2026年4月8日
    34401
  • AI网络安全新纪元:Claude Mythos Preview自主发现数千零日漏洞,Project Glasswing计划引发全球数字主权争议

    AI网络安全新纪元:Claude Mythos Preview自主发现数千零日漏洞,Project Glasswing计划引发全球数字主权争议 引言 人工智能正以前所未有的深度重塑网络安全攻防格局。近日,Anthropic联合亚马逊、苹果、微软、谷歌等十余家科技巨头及金融机构,正式启动 “Project Glasswing”(玻璃翼计划) ,旨在应对前沿AI…

    2026年4月8日
    80900
  • Claude Mythos震撼发布:AI自主挖掘数千零日漏洞,网络安全迎来历史性变革

    与之前Claude Code泄漏的代码所揭示的一致,Claude Mythos 正式登场。 今天凌晨,Anthropic 发布了大量关于其新模型 Claude Mythos Preview 的信息,包含一份长达 244 页的系统卡。同时,Anthropic 还宣布了一个基于此模型的 AI 网络安全项目 Project Glasswing。 作为人工智能领域的…

    2026年4月8日
    69400