Adobe vor Klassenausschluss wegen Urheberrechtsverletzung bei AI-Training
Adobe steht vor einer vorgeschlagenen Klasse-Handlungs-Klage, in der dem Unternehmen vorgeworfen wird, urheberrechtlich geschützte Werke von Autoren zur Trainingszwecken für künstliche Intelligenz missbraucht zu haben. Die Klage, die im Namen der Oregoner Autorin Elizabeth Lyon eingereicht wurde, behauptet, dass Adobe urheberrechtlich geschützte Bücher – darunter auch ihre eigenen – in verfälschten und kopierten Formen in die Trainingsdaten für sein KI-Modell SlimLM integriert hat. SlimLM, ein kleines Sprachmodell von Adobe, das für die Unterstützung bei Dokumentenarbeiten auf mobilen Geräten optimiert ist, wurde nach Angaben des Unternehmens auf dem Open-Source-Datensatz SlimPajama-627B vortrainiert, der im Juni 2023 von Cerebras veröffentlicht wurde. Laut der Klage basiert SlimPajama jedoch auf dem RedPajama-Datensatz, der wiederum den umstrittenen „Books3“-Korpus enthält – eine Sammlung von 191.000 Büchern, die in mehreren KI-Trainingsprojekten eingesetzt wurde. Die Klage argumentiert, dass die Verwendung von Books3, die urheberrechtlich geschützte Werke enthält, ohne Genehmigung, Anerkennung oder Entschädigung, eine Urheberrechtsverletzung darstellt. Lyon, die mehrere Leitfäden für die nichtfiktionale Schreibweise verfasst hat, behauptet, dass ihre Texte in einer verarbeiteten Version des Datensatzes enthalten waren, ohne dass sie informiert oder entlohnt wurde. Die Klage wirft Adobe vor, urheberrechtlich geschützte Inhalte zu nutzen, um kommerzielle KI-Produkte zu entwickeln, was die zunehmende Rechtsunsicherheit im Bereich der KI-Trainingsdaten unterstreicht. Ähnliche Rechtsstreitigkeiten haben bereits andere Tech-Riesen betroffen: Im September wurde Apple wegen der Nutzung von urheberrechtlich geschützten Werken zur Entwicklung von Apple Intelligence angeklagt, und im Oktober folgte eine ähnliche Klage gegen Salesforce. Diese Fälle sind Teil eines wachsenden Trends, bei dem Autoren und Urheberrechtsinhaber gegen Unternehmen vorgehen, die KI-Modelle auf Daten trainieren, die vermeintlich urheberrechtlich geschützte Inhalte enthalten. Im September hatte Anthropic eine außergerichtliche Einigung in Höhe von 1,5 Milliarden US-Dollar mit einer Gruppe von Autoren erzielt, die die gleiche Behauptung erhoben hatten. Die Entscheidung gilt als potenzieller Wendepunkt in der Rechtsprechung rund um KI-Trainingsdaten. Die Klage gegen Adobe könnte die Debatte um die ethische und rechtliche Verwendung von Textmaterial in KI-Systemen weiter anheizen, insbesondere angesichts der Tatsache, dass viele KI-Modelle auf massiven, oft unklar lizenzierten Datensätzen basieren. Branchenexperten warnen, dass die fehlende Transparenz in der Datensammlung und -verarbeitung die Reputationsrisiken für Tech-Unternehmen weiter erhöht. Adobe hat bislang keine offizielle Stellungnahme abgegeben. Die Entwicklung könnte langfristig zu strengeren Regulierungen und neuen Standards bei der Nutzung von Urheberrechten in der KI-Entwicklung führen.
