人工智能
美国法官驳回了出版社对OpenAI的版权诉讼
法院驳回Raw Story和AltNet的指控,允许修改申诉,讨论AI训练数据使用版权内容问题。
美国一位法官驳回了出版社Raw Story和AltNet对ChatGPT开发商OpenAI的诉讼,该诉讼指控OpenAI在构建训练集时非法移除了版权管理信息(CMI)。
Raw Story和AltNet声称,OpenAI移除版权状态描述后,导致了“实际损害”。原告还认为,OpenAI的系统存在较大风险,可能会在回答用户问题时“包含原告的版权保护作品内容”或直接输出其作品的全部或接近全文。
OpenAI的一位发言人向路透社表示:“我们使用公开数据训练AI模型,以符合合理使用原则和广泛接受的法律先例。”
今年二月,Raw Story和AltNet指控OpenAI在训练集使用其新闻作品,并剥夺了《数字千年版权法》保护的版权管理信息。
不过,美国地方法院法官Colleen McMahon批准了OpenAI的驳回请求。
在裁决中,她指出Raw Story和AltNet未能提出其文章内容受版权保护的具体指控,也无法这么做。
她表示:“当用户向ChatGPT输入问题时,ChatGPT会将数据库中的相关信息综合成答案。鉴于其中包含的信息数量,ChatGPT输出原告文章内容的概率微乎其微。”
然而,该法律裁决关系到OpenAI是否有权在未支付报酬的情况下使用记者文章来开发其产品。
“明确一下,这起诉讼的真正焦点并非OpenAI在训练集中排除CMI,而是使用原告文章来开发ChatGPT,却未向原告支付报酬,”她说。
McMahon还指出,这类损害的法律问题尚未提交给法院。她表示会允许原告修正申诉。
Raw Story和AltNet对OpenAI的案件是众多针对AI开发者使用版权材料训练模型的诉讼之一。OpenAI还面临多位作家Paul Tremblay、Sarah Silverman、Michael Chabon、David Henry Hwang和Ta-Nehisi Coates的类似诉讼。
另一组作家也在起诉Anthropic,指控其未经授权使用他们的版权作品来训练Claude AI模型。
去年,英国出版商协会(Publishers Association)CEO Dan Conway向上议院通讯与数字委员会表示,大型语言模型正在“广泛侵权”,并指出Books3数据库中列出了12万本盗版书,已被这些模型使用。
然而,AI开发者辩称,互联网信息的广泛访问对创新至关重要。
本文译自 The Register,由 BALI 编辑发布。