HyperAI

Die These, dass die Lizenz von Open-Source-Code, insbesondere der GNU General Public License (GPL), auf KI-Modelle übergeht, die auf solchem Code trainiert wurden, war 2021 mit der Einführung von GitHub Copilot ein zentraler Streitpunkt. Damals wurde gefürchtet, dass die Nutzung GPL-licensierten Codes im Trainingsdatensatz dazu führen könnte, dass das KI-Modell selbst unter die gleichen Bedingungen fallen müsste – also vollständig offen und mit Quellcode veröffentlicht werden müsste. Diese Vorstellung basierte auf der Annahme, dass ein Modell, das aus GPL-Code gelernt hat, eine „abgeleitete Arbeit“ darstellt und somit die Copyleft-Bedingungen überträgt. Doch bis 2025 hat sich die öffentliche Debatte deutlich verlagert: Während die These nicht mehr als Mainstream-Thema gilt, bleibt sie rechtlich ungelöst und wird durch zwei aktuelle Klagen weiter aufrechterhalten. Die Klage Doe v. GitHub (Copilot-Klassiklage) vor dem US-amerikanischen Bundesgericht für den Nordwesten Kaliforniens verfolgt die Behauptung, dass GitHub, Microsoft und OpenAI Open-Source-Code ohne Zustimmung genutzt und dabei Lizenzbedingungen wie Urheberrechtsnennung oder Quellcode-Offenlegung ignoriert hätten. Obwohl viele Ansprüche abgewiesen wurden – insbesondere solche auf Schadensersatz oder Verstoß gegen das DMCA – bleibt der Anspruch auf Verletzung von Open-Source-Lizenzen (als Vertragsbruch) lebendig. Das Gericht erkannte zwar keine Schadensersatzleistung an, erklärte aber, dass eine einstweilige Verfügung gegen das unzureichende Lizenzverhalten möglich sei. Wichtig ist, dass die Klage nicht direkt die GPL-Übertragung auf das Modell fordert, sondern darauf abzielt, dass die Nutzung von Lizenzcode ohne Einhaltung der Bedingungen rechtswidrig ist. Damit bleibt die Grundfrage offen: Kann die Verletzung einer Lizenz im Trainingsprozess die Rechtmäßigkeit der Modellverbreitung beeinträchtigen? Parallel dazu hat das deutsche Gericht in München im Fall GEMA v. OpenAI eine wegweisende Entscheidung getroffen: Es erklärte, dass das „Speichern“ von Liedtexten in den Parametern eines KI-Modells bereits eine rechtswidrige „Wiedergabe“ im Sinne des deutschen Urheberrechts darstellt. Selbst wenn die Inhalte nicht direkt lesbar sind, gilt ihre codierte Form als „Reproduktion“, wenn sie durch einfache Eingaben wiederhergestellt werden können. Diese Entscheidung ist bahnbrechend, weil sie die Vorstellung stützt, dass ein KI-Modell mehr sein kann als nur eine Analyse – es kann tatsächlich „Inhalte enthalten“, die urheberrechtlich geschützt sind. Diese juristische Grundlage könnte theoretisch auch für GPL-Code gelten: Wenn ein Modell GPL-Code „speichert“ und reproduzieren kann, könnte dies als „Wiedergabe“ gelten – und damit die Lizenzbedingungen auf das Modell übertragen werden. Trotz dieser Entwicklungen bleibt die praktische Umsetzung unwahrscheinlich. Juristisch, technisch und politisch gibt es starke Gegenargumente: KI-Modelle speichern keine Originaltexte, sondern statistische Muster; eine direkte Kopie ist selten und schwer nachweisbar. Die GPL selbst sieht keine Anwendung auf statistische Modelle vor – ihre Voraussetzungen wie „Quellcode für Änderungen“ sind für Modellgewichte nicht erfüllbar. Zudem würde die Anwendung der GPL auf ein Modell, das aus Tausenden von Lizenzen trainiert wurde, zu einer unmöglichen Verwaltung von 1 Mio. Lizenzbedingungen führen, was die Praxis unmöglich machen würde. Auch die Open Source Initiative (OSI) und die Free Software Foundation (FSF) lehnen eine automatische Übertragung ab, betonen aber die Notwendigkeit von Transparenz, offener Daten und offener Modelle – nicht durch Zwang, sondern durch ethische und technische Fortschritte. In Japan ist die Rechtslage grundsätzlich günstig: Artikel 30-4 des Urheberrechts erlaubt die Datensammlung für KI-Training, solange es nicht der „Genuss“ des Werks dient. Allerdings bleibt die Vertragsverletzung bei Lizenzverstößen ungelöst – der Copyright-Aspekt ist gedeckt, der Vertragsaspekt nicht. Die Rechtslage ist somit „rechtlich sicher, aber vertragsrechtlich unklar“. Zusammenfassend: Die Theorie der GPL-Übertragung auf KI-Modelle ist weder endgültig widerlegt noch anerkannt. Sie ist ein unbestimmter, aber potenziell gefährlicher Rechtsraum, der durch Gerichtsentscheidungen, technische Entwicklungen und politische Debatten weiter formbar ist. Die Community sollte sich nicht auf eine ideologische Auseinandersetzung konzentrieren, sondern auf realistische Lösungen wie offene Modelle, transparente Datensätze und automatisierte Lizenz-Management-Systeme setzen. Die Freiheit in der KI-Zeit erfordert nicht die Anwendung alter Lizenzen, sondern die Schaffung neuer, passender Standards. Die Herausforderung liegt nicht in der Rechtsauslegung, sondern in der Balance zwischen Innovation, Transparenz und dem Geist der freien Software.

Verwandte Links

Verwandte Links

Verwandte Links

Das MIT Hat Das Pichia-CLM-Modell Entwickelt, Um Die „Sprache“ Der Hefe-DNA Zu Erlernen Und so Möglicherweise Die Ausbeute an Exogenen Proteinen Um Bis Zu Das Dreifache Zu steigern.

Das MIT Hat Das Pichia-CLM-Modell Entwickelt, Um Die „Sprache“ Der Hefe-DNA Zu Erlernen Und so Möglicherweise Die Ausbeute an Exogenen Proteinen Um Bis Zu Das Dreifache Zu steigern.

Command Palette

GPL-Propagierung auf KI-Modelle: Rechtsunsicherheit bleibt bestehen

Verwandte Links

Command Palette

GPL-Propagierung auf KI-Modelle: Rechtsunsicherheit bleibt bestehen

Verwandte Links

Command Palette

GPL-Propagierung auf KI-Modelle: Rechtsunsicherheit bleibt bestehen

Verwandte Links

Das MIT Hat Das Pichia-CLM-Modell Entwickelt, Um Die „Sprache“ Der Hefe-DNA Zu Erlernen Und so Möglicherweise Die Ausbeute an Exogenen Proteinen Um Bis Zu Das Dreifache Zu steigern.

Das MIT Hat Das Pichia-CLM-Modell Entwickelt, Um Die „Sprache“ Der Hefe-DNA Zu Erlernen Und so Möglicherweise Die Ausbeute an Exogenen Proteinen Um Bis Zu Das Dreifache Zu steigern.