HyperAIHyperAI

Command Palette

Search for a command to run...

Adobe 被控滥用艺术家作品训练AI,面临集体诉讼

科技巨头Adobe近日被提起一项拟议的集体诉讼,指控其在未经许可的情况下,使用盗版书籍训练AI模型,涉嫌侵犯作者著作权。该诉讼由俄勒冈州作家伊丽莎白·莱昂(Elizabeth Lyon)代表提出,她本人是多部非虚构写作指南的作者。 诉讼称,Adobe在开发其小型语言模型SlimLM时,使用了名为SlimPajama-627B的开源数据集,而该数据集源于RedPajama,后者又包含一个名为Books3的大型图书集合。Books3收录了约19.1万本图书,其中就包括莱昂的著作。尽管Adobe声称SlimLM是基于“去重、多源、开源”的数据集训练而成,但诉讼指出,SlimPajama实为RedPajama的衍生版本,因此间接包含了受版权保护的文学作品。 莱昂的律师团队指出,这些作品在未获作者同意、未支付报酬、也未署名的情况下被复制、处理并用于AI训练,构成侵权。这一指控与近期多起针对科技公司的AI版权诉讼高度相似。例如,9月,苹果公司因涉嫌使用受版权保护内容训练“Apple Intelligence”模型而被起诉,同样提到了RedPajama数据集。10月,Salesforce也面临类似诉讼。 这些案件反映出,AI训练所依赖的海量数据中,常混杂着未经授权的受版权保护内容,已成科技行业普遍面临的法律风险。2023年9月,Anthropic曾以15亿美元和解金与一批作者达成和解,承认其AI模型Claude在训练中使用了盗版作品,被视为AI版权纠纷的转折点。 目前,Adobe尚未对此次诉讼作出公开回应。但随着AI技术的快速普及,如何合法获取和使用训练数据,正成为企业必须面对的核心挑战。

相关链接