大英百科起诉OpenAI:ChatGPT被控“四宗罪”,AI版权战火升级

OpenAI再次面临诉讼。

3月16日,大英百科全书公司及其旗下的韦氏词典,正式对OpenAI提起诉讼。

核心指控是,OpenAI的ChatGPT进行了大规模的版权侵权。

与其他原告相比,大英百科的诉状准备更为充分:它同时针对训练数据抓取、模型记忆输出、RAG实时检索三个环节提出指控,并追加了《兰纳姆法》下的商标侵权主张。

这被认为是AI版权诉讼史上,首次有原告试图对整个生成式AI的内容生产链路发起全面挑战。

GPT-4被指能逐字默写大英百科内容

据媒体报道,大英百科在诉状中直接点名GPT-4,指控该模型已经记忆并存储了大量其享有版权的材料,能够在用户提示下输出近乎逐字逐句的复制内容。

诉状强调,这并非近似,而是直接的“逐字复制”。

这一指控有其技术背景。斯坦福大学和耶鲁大学的研究团队曾进行实验,成功从主流大语言模型中提取出《哈利·波特》系列小说的原文,最高提取率可达96%。

大英百科起诉OpenAI:ChatGPT被控“四宗罪”,AI版权战火升级

这表明,训练数据中的大量版权内容,确实可能以某种形式被编码存储在模型的参数权重中,并在特定条件下被几乎原样还原。

大英百科拥有的版权内容体量庞大。其旗下拥有近10万篇在线文章、百科条目及词典释义,内容覆盖科学、历史、文学等几乎所有主要知识领域。

这些内容由专业编辑和学科专家历经数十年编撰而成。在互联网时代之前,这套知识体系曾是权威的标准索引。

而OpenAI的行为,被指一直在法律灰色地带运作。

实时检索内容也可能构成侵权?

此前,行业争论多集中于“使用版权内容训练模型是否构成侵权”。

大英百科此次的指控更进一步,分为三个层次:

第一层:未经许可,抓取其近10万篇版权内容用于大语言模型的训练。

第二层:ChatGPT在生成回答时,直接输出了大英百科内容的完整或部分逐字复制品,构成直接侵权。

第三层(最具争议):OpenAI在ChatGPT的“检索增强生成”(RAG)工作流中,使用了大英百科的文章。

RAG是ChatGPT等模型实时扫描外部数据库以获取最新信息的机制。

大英百科起诉OpenAI:ChatGPT被控“四宗罪”,AI版权战火升级

大英百科认为,即便其内容未被用于训练,但只要在实时检索环节被调用,同样构成侵权。

这一主张若被法院支持,将意味着无论静态训练还是动态检索,未经授权使用版权内容都可能需承担责任。

此外,诉状还包括第四条指控:违反《兰纳姆法》的商标侵权。

大英百科指出,ChatGPT有时会产生“幻觉”(编造事实),却将这些错误信息归因于大英百科,制造了后者生成错误内容的假象。

这不仅涉嫌侵权,更让大英百科的品牌信誉为OpenAI的错误“买单”,可能危及公众获取高质量、可信赖在线信息的能力。

核心争议:全球司法判决不一

“使用版权内容训练AI是否侵权”是本案核心,也是全球司法界争论最激烈的问题之一,目前各国判决存在分歧。

德国慕尼黑法院在GEMA诉OpenAI案中认定:GPT-4和GPT-4o的模型权重中嵌入了受版权保护的歌词,这构成了版权意义上的复制,原告可主张禁令和赔偿。

大英百科起诉OpenAI:ChatGPT被控“四宗罪”,AI版权战火升级

模型权重是AI在训练中学到的数值参数。慕尼黑法院的观点是,只要能从这些参数中还原出受保护作品,就足以构成侵权。

然而,英国高等法院在Getty Images诉Stability AI案中得出了相反结论。

大英百科起诉OpenAI:ChatGPT被控“四宗罪”,AI版权战火升级

法院认为,AI模型本身并非侵权副本,因为其权重并不包含也不复制版权作品本身,而只是存储了从数据中学到的规律性模式。

在美国,Anthropic曾在另一起版权诉讼中说服联邦法官William Alsup,主张将内容用作训练数据具有足够的“转化性”,可能适用“合理使用”原则。

但Alsup法官同时认定,Anthropic通过非法下载而非付费获取数百万本书籍的行为构成违法,此案最终以1.5亿美元达成集体和解。

大英百科诉OpenAI案在纽约提起,适用美国联邦法律。目前,美国尚未有确立性的先例明确判定使用版权内容训练大语言模型是否侵权,每起案件的结果在很大程度上仍取决于审理法官的具体认定。

如果法院最终支持“实时检索也构成侵权”的观点,其对整个AI行业的影响将远超任何一起单纯的训练数据纠纷。

起诉Perplexity:一场“热身”诉讼?

此次并非大英百科首次就此类问题发起诉讼。

早在2025年9月,大英百科就对AI搜索公司Perplexity提起了类似的版权和商标侵权诉讼,该案目前仍在审理中。

大英百科起诉OpenAI:ChatGPT被控“四宗罪”,AI版权战火升级

Perplexity是一家以RAG技术为核心的产品逻辑的AI搜索公司。

分析认为,大英百科选择先起诉Perplexity,可能意在通过此案进行“法律预演”,摸清针对RAG环节侵权指控的司法可行性,再将成熟的诉讼策略应用于对OpenAI的诉讼中。

与此同时,AI行业的版权战场正全面升温。

《纽约时报》、Ziff Davis出版集团、美国及加拿大十余家报纸已先后起诉OpenAI。

大英百科起诉OpenAI:ChatGPT被控“四宗罪”,AI版权战火升级

The Intercept和《美国新闻与世界报道》等媒体也已加入原告行列。

据专门追踪AI版权诉讼的网站ChatGPT Is Eating The World统计,此次诉讼已是针对OpenAI的第63起版权相关诉讼。

对于媒体的置评请求,OpenAI未予回应。

权威的困境:从维基百科到ChatGPT

跳出诉讼细节,一些更深层的背景值得关注。

大英百科全书创立于1768年,是英语世界历史最悠久的百科全书品牌,象征着数百年的人类知识整理传统。

当这样一个机构站上AI版权诉讼的原告席,其传递的信号是明确的:传统的知识权威正试图通过法律手段,在由AI主导的新生态中重新划定自己的边界。

大英百科曾是纸质时代的绝对知识权威,但在互联网时代,其地位被维基百科等开放平台极大冲击。

大英百科起诉OpenAI:ChatGPT被控“四宗罪”,AI版权战火升级

此后,它转型为数字订阅平台,依靠内容的可信度与专业性重新站稳脚跟。

如今,ChatGPT的出现构成了新的威胁——这种威胁并非来自一个更好的百科全书,而是来自一个使用其内容训练、却未向其支付任何费用的生成式模型。

诉状中的一句话点明了冲突的本质:ChatGPT通过生成替代出版商原有内容的回答,分流了本应属于出版商的流量。

这是商业模式的正面冲突。关于RAG实时检索是否侵权的指控,目前尚无定论。

但如果未来有法院认可这一逻辑,整个AI行业的实时检索技术管道都可能需要重新谈判授权。所有依赖“联网搜索+AI生成”模式的公司都将面临类似挑战。

这家拥有250年历史的知识权威,正试图通过一纸诉状,为AI的扩张划定一条法律边界。

这条边界最终将画在哪里?答案或许在2026年揭晓。

参考资料


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/26974

(0)
上一篇 2026年3月22日 上午10:57
下一篇 2026年3月23日 上午8:31

相关推荐

  • 摩尔线程LiteGS斩获SIGGRAPH Asia银奖:3D高斯溅射技术突破60秒高质量重建极限

    在近期于香港举办的SIGGRAPH Asia 2025国际图形学顶级学术会议上,摩尔线程凭借其自主研发的3D高斯溅射(3DGS)基础库LiteGS,在3DGS重建挑战赛中荣获银奖。这一成就不仅展示了摩尔线程在算法创新与软硬件协同优化方面的深厚实力,也标志着该公司在新一代图形渲染技术领域获得了学术界的高度认可。 3D高斯溅射作为2023年提出的革命性三维场景表…

    2025年12月17日
    40200
  • 智谱华章登陆港交所:全球大模型第一股,市值528亿港元开启AGI新纪元

    「全球大模型第一股」来了! 2026年1月8日,北京智谱华章科技股份有限公司(02513.HK)正式在香港联合交易所挂牌上市。 至此,全球首家以通用人工智能(AGI)基座模型为核心业务的上市公司花落中国。 智谱首日开盘价120港元/股,市值528.28亿港元。 在本次IPO发行中,智谱香港公开发售获1159.46倍认购,国际发售获15.28倍认购。以每股11…

    2026年1月8日
    35500
  • ArchAgent:AI仅用两天设计出性能提升5.3%的缓存策略,颠覆传统硬件设计

    关键词:AI 驱动硬件设计、缓存替换策略、大语言模型、进化算法、计算机架构 一个完全由 AI 驱动的系统,在没有任何人类干预的情况下,仅用两天时间就设计出了一款比现有最优方案性能提升 5.3% 的缓存替换策略——而人类专家团队完成同样的工作通常需要数月之久。 ArchAgent: Agentic AI-driven Computer Architecture…

    2026年3月14日
    29500
  • SciencePedia:构建科学知识的动态进化图谱,重塑认知操作系统

    在信息爆炸与知识碎片化的时代,用户对深度、体系化科学知识的需求日益增长,而传统知识平台正面临多重挑战。维基百科虽在原理陈列上具有权威性,但其静态条目结构难以呈现知识的动态演化与跨学科关联;ArXiv等学术平台聚焦最终结论,却缺乏对科学发现过程的还原;通用AI助手虽能快速响应,但受限于浅层检索与幻觉风险,无法支撑系统性的科学认知构建。马斯克推出的Grokipe…

    2025年10月30日
    39500
  • ICLR评审重置风波:AI顶会机制在漏洞冲击下的系统性反思

    近日,国际表征学习会议(ICLR)因审稿系统漏洞引发的“开盒事件”持续发酵,官方宣布将所有论文的领域主席(AC)重新分配,并将所有审稿意见与评分重置回讨论前状态。这一决定在国内外AI社区引发轩然大波,不仅暴露了学术评审流程的技术脆弱性,更引发了关于AI顶会评审机制公平性、效率与可持续性的深层讨论。 从技术层面看,此次事件源于审稿系统漏洞被少数作者恶意利用,导…

    2025年11月29日
    31700