英伟达主动接洽盗版站点获取书籍训练AI 深陷作家集体版权诉讼

全球芯片巨头英伟达（NVIDIA）近期因 AI 模型训练数据来源问题深陷法律纠纷。一份最新提交给美国加州法院的修正起诉书披露了惊人细节:英伟达被指控为了在竞争中保持领先，主动与全球知名的盗版电子书站点 Anna’s Archive 进行接触，试图获取数百万本受版权保护的书籍。

原告方由 Abdi Nazemian 等多位作家组成，他们声称英伟达在面临2023年开发者大会的交付压力下，内部战略团队成员曾直接询问 Anna’s Archive 能提供哪些资源，并表达了将其纳入大语言模型（LLM）预训练数据的意愿。指控指出，尽管对方曾明确提醒其馆藏属于非法获取，英伟达管理层仍在一周内“开绿灯”批准继续推进，从而获得了约500TB 的海量数据访问权。

除了 Anna’s Archive ，起诉书还提到英伟达可能使用了 LibGen、Sci-Hub 及 Z-Library 等其他“影子图书馆”的数据来源。此外，该公司还被指向企业客户分发工具，协助其自动获取包含盗版作品的数据集，因此被指控存在“替代侵权”和“共同侵权”行为。英伟达此前曾试图以“合理使用”为由进行辩解，但随着这些内部邮件等关键证据的流出，案件正向着更有利于版权方的方向发展。

划重点:

️ 深陷集体诉讼:多位知名作家联合指控英伟达大规模使用盗版图书训练其 NeMo、Megatron 等核心模型。
主动接洽盗版源:内部邮件显示英伟达曾主动联络 Anna’s Archive ，甚至询问如何通过支付费用获得500TB 数据的高速下载权限。
️ 侵权指控升级:原告不仅指控其内部训练违规，还控诉英伟达向客户提供自动化脚本，间接助长了盗版数据的二次传播。

英伟达主动接洽盗版站点获取书籍训练AI 深陷作家集体版权诉讼

分类推荐

相关内容

资讯姬

最新评论

链接

搜索一下

搜索

您还没有登录

英伟达主动接洽盗版站点获取书籍训练AI 深陷作家集体版权诉讼

分类推荐

相关内容

资讯姬

最新评论

链接

搜索一下

搜 索

感谢您的打赏

分享文章

搜索