Anthropic胜诉版权案,但仍因使用盗版书籍受罚
美国加利福尼亚北部地区法院法官威廉·阿尔斯普于6月24日裁定,人工智能公司Anthropic使用合法购买的书籍训练其AI模型的行为属于合理使用,不构成侵犯版权。这一裁决标志着首次有法院认可AI公司在使用受版权保护材料训练大型语言模型(LLM)时,可以通过“合理使用”原则免除责任。虽然这一裁决对其他法官是否跟进仍存在不确定性,但它为同类纠纷设定了重要先例。 本案中,三位作者 Andrea Bartz、Charles Graeber 和 Kirk Wallace Johnson 去年在联邦法院提起诉讼,指控 Anthropic 使用他们的作品未经授权训练其AI模型Claude,称这是一种“大规模盗窃”。而 Anthropic 则辩称其行为是合理的,因为训练 LLM 的目的是创造全新的内容,而非直接复制或替代原有作品。根据法官阿尔斯普的说法:“像任何渴望成为作家的读者一样,Anthropic 的 LLM 并不是为了快速复制或取代这些作品,而是为了转变方向,创造出截然不同的东西。”他认为,这种训练是“本质上富有转化性的”,因此符合合理使用原则的定义。 然而,法官并未完全放过 Anthropic。裁决书还指出,公司将通过非法途径获取的数百万书籍存入自己的“中央图书馆”违反了版权法,并将对此部分行为单独进行审理。“即使后来购买了先前盗取的书籍副本,也无法使公司免于承担法律责任,但可能会影响法定赔偿金额。” 近年来,随着基于 AI 训练的语言学习模型快速发展,关于合理使用的法律争论愈发激烈。合理使用是1976年版《著作权法》中的一个重要例外条款,用于界定在特定情况下使用受版权保护的作品是否合法。该条款考虑的是使用目的、商业化程度以及衍生作品与原作之间的转化度。除了 Anthropic,其他科技巨头如Meta、微软等也因类似问题面临诉讼。这些争议主要集中在使用从网上获得的免费和盗版资源进行训练是否合法。此次 Anthropic 裁决中的明确界限表明,即便是在合理使用的范畴内,获取数据的方式依然必须遵守法律规定。 此外,该案件还凸显了科技公司与创作者之间日益加剧的利益冲突。许多作者和艺术家认为,未经许可的大规模使用他们的原创作品训练 AI 模型,是对知识产权的公然侵犯。同时,部分媒体公司和出版商正在尝试通过授权内容给这些科技企业谋取补偿,从而找到一条平衡之路。