生成式AI:创作还是窃取?法律与版权的灰色地带
自2022年11月ChatGPT推出以来,生成式人工智能(GenAI)的迅猛发展引发了不少关于版权侵权的担忧与辩论。许多内容创作者感到愤怒,他们认为自己的作品未经许可被用于训练AI系统,既没有获得认可也没有得到任何报酬。这些争议的核心在于,AI是否在实际上“复制”了受版权保护的材料,进而侵犯了创作者的权利。 目前,已有多个涉及版权侵权的诉讼案件,尽管有早期胜利案例(如Thomson Reuters vs. Ross AI),但该案件并未使用生成式AI技术,因而不具备广泛的代表性。现在大约有十个官司正在进行,而天平似乎正在向AI公司倾斜。原因在于,AI技术的工作原理并不像传统的“复制”那样简单直接。据Substack作家Enrique Dans解释,AI不是简单地存储和复制数据,而是“转化、混音和重新解读”,产生新的内容。这一过程更像是艺术家通过对前人作品的学习来形成自己独特创作风格的过程,而不是照搬原作。 以ChatGPT为例,其内部并不会保存完整的训练数据集。所有内容都被转化为数字矩阵中的数亿个数值,这些数值描述了数据子集之间的复杂关系。因此,如果你想通过分析ChatGPT的代码来找回某个特定的音乐歌词或图像,将会一无所获。即便《蒙娜丽莎》这样的名画被用于训练,也不可能在训练完成后从系统中找到其任何痕迹。 然而,版权持有者的诉求并不容易被完全忽视。最近的一起案件就反映了这一复杂的局面。2022年底,音乐公司Concord Music Group起诉Anthropic公司,指控后者在其AI训练过程中“系统性、大范围地侵犯其音乐歌词的版权”。Anthropic方面则辩称,这些歌词广泛存在于互联网上,且其使用符合“合理使用”原则。Anthropic进一步指出,AI系统的训练目的并不在于生成完整歌词,只有通过刻意的提示指令才可能实现这一点。此外,他们强调系统从未实际存储过这些歌词,仅仅是通过数据之间的统计关系进行处理。 法院最终拒绝了Concord Music Group的要求,未裁定Anthropic暂停使用受版权保护的歌词进行训练,并驳回了Concord提出的其他所有指控。这一判决的关键在于Concord未能证明其遭受了立即且不可挽回的损害。对于法官来说,缺乏“直接复制”的证据使得版权侵权难以成立。这并不意味着创作者的情感诉求没有道理,毕竟他们的作品确实为AI的发展贡献了一己之力,但他们却未能从中获取应有的认可和利益。 AI是否在“偷窃”?从情感角度讲,许多人认为答案是肯定的。但从法律角度来看,当前的情况下,很难认定其行为违法。不过,未来版权法的变革可能会对此情况有所调整。作为科技领域的专家,Steven Boykey Sidley建议,IP权利的代表律师应设法让法官理解AI虽然不直接“存储”内容,但确实“记住”了这些内容,只是以一种全新的数学语言形式存在。 对于AI公司而言,这次诉讼案的胜利可能是其长远发展中的一个转折点,但同时也暴露了现行版权法规在面对新兴技术时的局限。随着技术的进步和社会认知的变化,未来的版权法或将迎来一场深刻的改革,以更好地平衡创作者权益与公众利益之间的关系。而这场变革的终点究竟会在何处,依然是一个悬而未决的问题。 Steven Boykey Sidley教授不仅在约翰内斯堡大学任教,还有丰富的业界经验,他担任Bridge Capital的合伙人,并且是Daily Maverick的高级撰稿人。他在加密行业及所有权领域有深入研究,最新著作《这是我的:加密行业如何重新定义所有权》探讨了这一前沿话题,引发了业内广泛讨论。
