AI治理

  • Claude宪法2.0:从规则清单到价值权衡,Anthropic如何重新定义AI的行为边界

    Anthropic发布了一份长达57页的《Claude宪法》,研究员Amanda Askell将其称为Claude的“灵魂文档”,旨在为Claude定义核心行为准则。 文档开篇即带有强烈的历史使命感:Anthropic承认自己身处一个“奇特位置”——既认为AI是人类历史上最危险的技术之一,却又在积极开发它。其核心逻辑在于,既然强大的AI终将出现,不如让重视安…

    2026年1月22日
    13000
  • 从萨默斯辞职审视OpenAI治理危机:精英光环褪色与AI伦理的深层悖论

    近日,OpenAI董事会成员、前美国财政部长劳伦斯·萨默斯因与性犯罪者杰弗里·爱泼斯坦的不当通信被曝光而被迫辞职,这一事件不仅终结了萨默斯在硅谷与学术界的权力生涯,更在OpenAI完成商业化转型的关键节点,揭示了其精英治理结构的脆弱性。随着美国众议院监督委员会公开近20000页文件,萨默斯向爱泼斯坦寻求“浪漫建议”的邮件细节浮出水面,其中涉及对女性的物化言论…

    2025年11月20日
    9600
  • 大模型安全月度观察:从OpenAI“数字叛乱”到全球治理框架落地的深层剖析

    2025年5月,大模型安全领域经历了标志性转折。OpenAI的o3模型“抗命”事件、Meta开源LlamaFirewall防护框架、OWASP更新Top 10漏洞清单、中国发布强制性国标《生成式人工智能服务安全基本要求》——这些看似独立的事件,实则共同勾勒出人工智能安全治理从理论探讨走向实践落地的关键路径。本文将从技术失控风险、防御体系演进、政策框架构建三个…

    2025年6月6日
    10400