学术出版巨头爱思唯尔联手起诉Meta：非法爬取论文训练Llama，版权大战升级

11小时前 • AI产业动态 • 阅读 35

AI版权战火再燃：学术出版巨头爱思唯尔联手起诉Meta，指控其非法爬取论文训练Llama

AI领域的版权纠纷，如今迎来了前所未有的升级。

手握《柳叶刀》《细胞》等顶级期刊、掌控全球海量核心科研成果的学术出版巨头爱思唯尔（Elsevier） 正式下场，加入集体诉讼阵营，直接硬刚Meta——指控其非法爬取并复制受版权保护的科研论文，用于训练自家的大语言模型Llama。

在此之前，站出来起诉AI侵权的多是作家或媒体机构。这是头一回，顶级学术出版商主动打响版权维权之战。美国出版商协会也在声明中定调：

这是主流出版集团首次发起针对AI企业的诉讼。Meta明目张胆地侵犯版权，出版商们将还原全部事实。

有趣的是，这场官司表面上的矛头对准Meta，但证据一摊开，与爱思唯尔纠缠十多年的两大盗版学术库——LibGen和Sci-Hub，再次被摆上台面。只能说Meta树大钱多，追责它比追责盗版平台靠谱得多。

多方原告组团上阵，指控Meta侵权

这场诉讼于5月5日在纽约南区法院正式提交，被告直指Meta及其CEO扎克伯格。原告方不止爱思唯尔一家，还包括法国第一大出版集团阿歇特、源自英国的百年全球综合性出版集团麦克米伦，以及美国小说家、执业律师Scott Turow等。

出版商的核心指控非常明确：Meta为训练Llama大语言模型，未经任何授权，大量获取、复制、盗用受版权保护的学术论文与出版物内容。

具体来看，诉状指出Meta训练Llama主要依赖两大“不清白”的数据来源：

Common Crawl通用爬虫数据集：这份数据集通过全网抓取生成，囊括数十亿网页内容。原告方称，里面大概率混进了未经授权的版权内容，比如付费期刊的摘要和全文。
两大知名盗版学术平台LibGen和Sci-Hub：这两个网站常年免费传播海量付费论文、教材与学术著作，长期深陷全球版权诉讼。出版商指控，Meta通过磁力下载、文件共享等方式，从这些网站盗用学术资源。

值得一提的是，本案很多证据来自去年那桩“作家告Meta”（Kadrey v. Meta）案里流出的内部员工邮件。

面对诉讼，Meta发言人表示将全力积极应诉。Meta的抗辩逻辑也十分清晰，打出了一张王牌：合理使用（Fair Use）。

据了解，根据美国版权法，“合理使用”属于版权豁免情形，允许在特定条件下无需授权使用版权内容。Meta发言人称：“AI正为个人与企业带来颠覆性创新、提升生产效率与创作活力。已有法院判例认定，使用版权内容训练AI可构成合理使用。”

不得不说，这几年AI圈的版权官司确实不少。像《纽约时报》、一堆知名作家都起诉过AI公司，有些案子已经和解了。但整体而言，利用版权作品训练大语言模型是否合法，目前仍未形成明确的司法判例。至于这次后续怎么发展……咱们先搬好小板凳，再蹲一波。

One More Thing

“合理使用”这张牌之前确实被成功使用过。去年，美国法院裁决：允许Claude背后公司Anthropic在未经作者许可的情况下，使用合法购买的已出版书籍训练AI。法院参考了美国版权法中的“合理使用”原则，认为AI训练属于“转化性使用”（Transformative Use），即对原作品的新用途未取代原作市场，且有利于技术创新和公共利益。这也是美国法院首次认可AI公司对书籍的使用权。

就在最近，有网友称Anthropic正在大批量购入古籍，扫描收录内容后就直接销毁原书。这一说法也引发了不少网友关注。

参考链接：
[1]https://www.nature.com/articles/d41586-026-01481-0
[2]https://x.com/sivori/status/2052567312088047754

中国AIGC产业峰会最新嘉宾阵容来了！

从AI最新架构到应用生态，从AI音乐、AI漫剧、AI浏览器再到世界模型、AI硬件… 这一次，我们希望聚齐AI赛道的实战派，百度、智谱、昆仑万维、模思智能、蚂蚁灵波都会来。🔍了解详情

5月20日，北京·金茂万丽酒店，@所有人，马上AI起来！ 👉 报名参会

关注“鲸栖”小程序，掌握最新AI资讯

本文来自网络搜集，不代表鲸林向海立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/archives/34408

学术出版巨头爱思唯尔联手起诉Meta：非法爬取论文训练Llama，版权大战升级

AI版权战火再燃：学术出版巨头爱思唯尔联手起诉Meta，指控其非法爬取论文训练Llama

多方原告组团上阵，指控Meta侵权

One More Thing

相关推荐

沐曦MXMACA 3.3.0.X发布：国产GPU生态兼容突破，CUDA项目迁移成功率超92%

Emu3.5：原生多模态世界模型的突破与全场景应用解析

腾讯青云奖学金首秀：姚顺雨亲颁百万奖金，揭秘AI人才培养新战略

GPT-6即将发布：性能暴涨40%、原生多模态、2M上下文窗口，OpenAI倾注所有资源冲刺AGI

华人学者苏炜杰获2026考普斯奖：为大语言模型建立严格统计基础，14年来首位华人得主