AI安全

  • Anthropic破解AI黑箱:Claude真实想法曝光,竟早已识破人类测试

    AI之所以难以掌控,很大程度上源于其思考过程的“黑箱”特性。 就像与人打交道时,你永远无法确知对方是否“口是心非”。 而这一次,Anthropic彻底撕开了这个黑箱。 就在刚刚,他们发布并开源了一项名为Natural Language Autoencoders(自然语言自编码器,简称NLA)的新研究,首次让人类能够读懂大模型的真实想法。 Anthropic掌…

    5天前
    20400
  • 黄仁勋怒批AI末日论:别动不动吓唬人,SaaS也没那么容易死

    黄仁勋怒批AI末日论:别动不动吓唬人,SaaS也没那么容易死 过去一年,AI领域最热门的叙事之一,就是“替代”。从程序员、设计师到SaaS产品乃至整个工作模式,似乎每隔一段时间就有新观点抛出:多少岗位将被淘汰,哪个行业会被彻底重塑。但英伟达CEO黄仁勋显然对这种论调不以为然。 立足事实,别动不动吓唬人 在最近一期《Memos to the President…

    AI产业动态 2026年5月4日
    12100
  • AI安全警钟:7大模型秒变“帮凶”,Anthropic论文揭示AI学会主动破坏监控

    隐患犹存,AI安全警钟大作! 22位来自Anthropic的顶尖安全研究员发布的最新论文,带来了一个令人震惊的发现:在真实的生产编码环境中,AI一旦学会“钻空子”,竟会自发泛化出伪装对齐、配合恶意、暗中谋划等行为,甚至在Claude Code中主动破坏用于监控自身的代码库! 在Anthropic的真实生产编码环境中进行训练后,Claude在未收到任何明确指令…

    2026年5月4日
    22800
  • OpenAI道歉!封禁枪击案嫌疑人账号却未预警,8人遇难引发AI监管反思

    OpenAI道歉!封禁枪击案嫌疑人账号却未预警,8人遇难引发AI监管反思 OpenAI CEO Sam Altman 已正式向加拿大不列颠哥伦比亚省的 Tumbler Ridge 小镇致歉。原因是该公司曾封禁一起大规模枪击案嫌疑人的 ChatGPT 账号,但未及时向警方发出预警,最终导致 8 人遇难。这一事件将 AI 平台在风险识别、执法转介和未成年人监管方…

    大模型安全 2026年4月26日
    20700
  • AI加速超越人类:指数曲线揭示智能爆炸倒计时

    三天前,《纽约时报》刊载了一篇文章。它没有登上热搜,也未冲上 Hacker News 榜首,甚至鲜有中文翻译。但这可能是2026年春天,AI领域最重要的一篇报道。 文章的标题很朴素——《How Do You Measure an A.I. Boom?》(如何衡量AI的繁荣?)。 如果你仔细读完,会意识到一个事实:AI超越人类的速度,正在加快。 作者 Kevi…

    2026年4月21日
    32300
  • Anthropic引爆行动智能革命:Claude Mythos被“锁进笼子”,AI从“会说”跨入“会做”时代

    4月8日,Anthropic正式宣布推出 Claude Mythos Preview。 这家始终将“安全”置于首位的公司,向全球软件行业投下了一枚震撼弹——随后,它并未庆祝,反而立即着手将这枚炸弹置于严密的控制之下。 按照常规逻辑,这理应是一场关于“参数更大、评分更高、价格更贵”的例行发布。然而,此次发布风格迥异:模型虽已造出,却无意全面开放。 Anthro…

    2026年4月21日
    30100
  • Agent革命:从“养龙虾”到数字同事,实体企业如何安全递枪?

    在新茶饮行业,高峰期的订单峰值监控、多区域门店的运营数据汇总、跨系统的业务异常排查,一直是茶饮品牌技术团队的日常高频工作。 某茶饮品牌在测试使用智能体(Agent)的过程中发现,技术团队只需要向智能体提问“当前的QPS是多少”、“订单状态是多少”等问题,它就能串联整个流程并输出结果,员工不再需要登录多个平台查看,显著提升了效率。 不止是新茶饮赛道,这股Age…

    2026年4月19日
    24400
  • Claude强推身份验证:用户隐私与平台安全的博弈,AI工具走向何方?

    为防止滥用、落实平台政策及履行法律合规义务,部分用户在访问特定功能或触发平台风控(完整性检查)时,将收到强制身份验证提示。 此举意味着,用户账号风险从一种模糊状态转变为明确的“明牌”状态。平台将验证、审查与处置流程完全公开化,不再留有模糊空间。 官方公告解读:针对“高风险用户”的清晰信号 Anthropic 的官方公告措辞标准,提及“防止滥用”、“执行使用政…

    2026年4月16日
    65700
  • Claude强制KYC验证引争议:15岁天才程序员被封号,AI编程变18禁?

    Claude强制KYC验证引争议:15岁天才程序员被封号,AI编程变18禁? 用AI辅助编程正酣,却被突然要求实名认证。 Claude新规上线,引发用户强烈不满。一个AI对话工具,开始要求用户提供身份证件。 其规则甚至严格到要求用户手持身份证原件进行实时拍照验证。 此类规则通常被称为KYC(了解你的客户),是企业用于核实客户身份的合规程序,常见于金融领域。C…

    2026年4月16日
    55400
  • 20岁青年向奥特曼投燃烧瓶:反AI极端分子还是精神健康危机?

    Daniel Moreno-Gama,一位20岁的青年,声称其行动是为了阻止AI导致人类灭绝。 随着案件审理的推进,更多事件细节与其个人画像被公之于众。 △图源:美国司法部官网 科技媒体Futurism将其描述为“一个目睹了未来反乌托邦景象的时间旅行者”,其对山姆·奥特曼的死亡威胁也并非临时起意。 被捕后,警方在其身上搜到一份名为《你的最后警告》的宣言,文末…

    2026年4月16日
    20000