HyperAIHyperAI

Command Palette

Search for a command to run...

Anthropic 15亿美元和解背后:AI数据“圈地运动”步入终结?

AI公司Anthropic以15亿美元和解集体版权诉讼,标志着生成式AI行业数据“圈地运动”的转折点。该案核心争议在于,Anthropic是否使用了从非法“影子图书馆”Library Genesis下载的盗版书籍训练其大语言模型Claude。美国法官William Alsup的裁决明确指出:即便AI训练具有“变革性”,但若数据来源非法,后续使用无法获得版权法“合理使用”的保护。这一判决将法律焦点从抽象的“合理使用”之争,转向具体事实——数据获取是否合法。 这一裁决极大提升了Anthropic的诉讼风险,若败诉,可能面临高达万亿美元的赔偿。因此,15亿美元和解被视为规避颠覆性法律后果的必要代价。此案虽未确立“AI训练是否合理使用”的判例,却划清了一条不可逾越的红线:数据合法性是所有AI开发的前提。 这并非孤例。OpenAI面临《纽约时报》诉讼,指控其ChatGPT生成内容直接替代新闻报道,构成市场损害;艺术家起诉Midjourney和Stability AI,质疑其复制个人艺术风格;唱片公司则控诉Suno和Udio未经授权使用录音版权。这些案件共同指向一个核心:AI训练是否构成合理使用,取决于四个因素,尤其是对原作品市场价值的影响。 当前政府政策态度模糊。特朗普政府发布的AI行动计划刻意回避版权议题,反映出政策层面的犹豫。但总统本人却在公开场合表态支持AI“无需为每篇文章付费”,形成政策与言论的矛盾,使行业在缺乏明确指引下自行博弈。 面对不确定性,企业开始分化应对。OpenAI通过与新闻集团等签署授权协议,构建合法数据渠道;谷歌则坚持“合理使用”辩护,依赖其搜索引擎时代的法律经验。与此同时,内容平台加速反击。Cloudflare推出AI抓取监测工具,并联合Reddit、雅虎、Medium等推出“真正简单许可”(RSL)标准,赋予网站机器可读的使用许可权。更关键的是,基础设施公司正开发技术手段,帮助网站主动阻断AI爬虫。 这一趋势预示着:曾经免费获取网络数据的时代正在终结。未来,AI公司若想持续训练模型,将不得不面对一个由技术强制、明码标价的数据许可市场。互联网数据,正开始提出自己的交易条件。

相关链接