学术出版巨头爱思唯尔联手起诉Meta:非法爬取论文训练Llama,版权大战升级

AI版权战火再燃:学术出版巨头爱思唯尔联手起诉Meta,指控其非法爬取论文训练Llama

AI领域的版权纠纷,如今迎来了前所未有的升级。

手握《柳叶刀》《细胞》等顶级期刊、掌控全球海量核心科研成果的学术出版巨头爱思唯尔(Elsevier) 正式下场,加入集体诉讼阵营,直接硬刚Meta——指控其非法爬取并复制受版权保护的科研论文,用于训练自家的大语言模型Llama。

在此之前,站出来起诉AI侵权的多是作家或媒体机构。这是头一回,顶级学术出版商主动打响版权维权之战。美国出版商协会也在声明中定调:

这是主流出版集团首次发起针对AI企业的诉讼。Meta明目张胆地侵犯版权,出版商们将还原全部事实。

有趣的是,这场官司表面上的矛头对准Meta,但证据一摊开,与爱思唯尔纠缠十多年的两大盗版学术库——LibGen和Sci-Hub,再次被摆上台面。只能说Meta树大钱多,追责它比追责盗版平台靠谱得多。

多方原告组团上阵,指控Meta侵权

这场诉讼于5月5日在纽约南区法院正式提交,被告直指Meta及其CEO扎克伯格。原告方不止爱思唯尔一家,还包括法国第一大出版集团阿歇特源自英国的百年全球综合性出版集团麦克米伦,以及美国小说家、执业律师Scott Turow等。

出版商的核心指控非常明确:Meta为训练Llama大语言模型,未经任何授权,大量获取、复制、盗用受版权保护的学术论文与出版物内容。

具体来看,诉状指出Meta训练Llama主要依赖两大“不清白”的数据来源:

  1. Common Crawl通用爬虫数据集:这份数据集通过全网抓取生成,囊括数十亿网页内容。原告方称,里面大概率混进了未经授权的版权内容,比如付费期刊的摘要和全文。
  2. 两大知名盗版学术平台LibGen和Sci-Hub:这两个网站常年免费传播海量付费论文、教材与学术著作,长期深陷全球版权诉讼。出版商指控,Meta通过磁力下载、文件共享等方式,从这些网站盗用学术资源。

值得一提的是,本案很多证据来自去年那桩“作家告Meta”(Kadrey v. Meta)案里流出的内部员工邮件。

面对诉讼,Meta发言人表示将全力积极应诉。Meta的抗辩逻辑也十分清晰,打出了一张王牌:合理使用(Fair Use)

据了解,根据美国版权法,“合理使用”属于版权豁免情形,允许在特定条件下无需授权使用版权内容。Meta发言人称:“AI正为个人与企业带来颠覆性创新、提升生产效率与创作活力。已有法院判例认定,使用版权内容训练AI可构成合理使用。”

不得不说,这几年AI圈的版权官司确实不少。像《纽约时报》、一堆知名作家都起诉过AI公司,有些案子已经和解了。但整体而言,利用版权作品训练大语言模型是否合法,目前仍未形成明确的司法判例。至于这次后续怎么发展……咱们先搬好小板凳,再蹲一波。

One More Thing

“合理使用”这张牌之前确实被成功使用过。去年,美国法院裁决:允许Claude背后公司Anthropic在未经作者许可的情况下,使用合法购买的已出版书籍训练AI。法院参考了美国版权法中的“合理使用”原则,认为AI训练属于“转化性使用”(Transformative Use),即对原作品的新用途未取代原作市场,且有利于技术创新和公共利益。这也是美国法院首次认可AI公司对书籍的使用权

就在最近,有网友称Anthropic正在大批量购入古籍,扫描收录内容后就直接销毁原书。这一说法也引发了不少网友关注。

参考链接:
[1]https://www.nature.com/articles/d41586-026-01481-0
[2]https://x.com/sivori/status/2052567312088047754

中国AIGC产业峰会最新嘉宾阵容来了!

从AI最新架构到应用生态,从AI音乐、AI漫剧、AI浏览器再到世界模型、AI硬件… 这一次,我们希望聚齐AI赛道的实战派,百度、智谱、昆仑万维、模思智能、蚂蚁灵波都会来。🔍了解详情

5月20日,北京·金茂万丽酒店@所有人,马上AI起来! 👉 报名参会


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/34408

(0)
上一篇 11小时前
下一篇 7小时前

相关推荐

  • 沐曦MXMACA 3.3.0.X发布:国产GPU生态兼容突破,CUDA项目迁移成功率超92%

    近日,国产GPU公司沐曦股份在完成IPO后,发布了其上市以来的首个重大技术更新——MXMACA软件栈(MACA)的全新版本3.3.0.X。该版本标志着沐曦在软件生态建设上实现了一次重要跨越,其核心目标是解决国产GPU“用起来”的关键问题。 在全自主硬件体系的支持下,沐曦构建了完整的“全栈软件”体系,旨在最大化释放硬件算力。MACA(MetaX Acceler…

    2025年12月29日
    1.4K00
  • Emu3.5:原生多模态世界模型的突破与全场景应用解析

    Emu3.5是由北京智源研究院最新发布的大规模多模态世界模型,其核心创新在于原生支持视觉与语言的联合状态预测。该模型采用统一的下一token预测目标进行端到端预训练,训练数据规模超过10万亿token,主要来源于互联网视频的连续帧及其转录文本,这为模型理解动态视觉序列与语言描述的关联性奠定了坚实基础。 模型架构设计上,Emu3.5天然接受交错的视觉-语言输入…

    2025年11月1日
    43700
  • 腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略

    闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 来围观腾讯青云奖学金颁奖,竟然偶遇了姚顺雨。 这位27岁的腾讯首席AI科学家,在腾讯大楼的线下公开亮相,不是发布重磅产品,也不是解读战略布局——而是给一群青年研究者颁发青云奖学金。 上一次他在公开场合露面还是在AGI-Next前沿峰会上。这波在腾讯的首秀确实“不按常理出牌”。 为更值得的探索 青云奖学金是…

    2026年1月31日
    28100
  • GPT-6即将发布:性能暴涨40%、原生多模态、2M上下文窗口,OpenAI倾注所有资源冲刺AGI

    据多方消息透露,OpenAI 下一代旗舰模型 GPT-6 的发布可能已进入倒计时。内部信息显示,该公司正将几乎所有资源倾注于这一项目,旨在实现通往通用人工智能(AGI)的关键突破。 核心特性与定位 据悉,GPT-6 被内部视为实现AGI目标的“最后一公里”。其主要特性传闻包括:* 性能飞跃:在代码、推理及智能体任务等基准测试上,性能较 GPT-5.4 提升约…

    2026年4月5日
    1.1K00
  • 华人学者苏炜杰获2026考普斯奖:为大语言模型建立严格统计基础,14年来首位华人得主

    在时隔14年之后,有着“统计学诺贝尔奖”之称的考普斯奖(COPSS Presidents’ Award),又一次迎来了华人得主。 2026年考普斯奖颁给了北大校友、现宾夕法尼亚大学副教授苏炜杰。 奖项委员会给他的评语是:“为大语言模型的多项应用建立了严格的统计基础;在隐私保护数据分析方面取得突破性进展,并成功应用于2020年美国人口普查;设计了A…

    2026年2月7日
    38300