Meta bestreitet, Pornotorents für KI-Training genutzt zu haben
Meta hat eine Klage zurückgewiesen, die behauptet, das Unternehmen habe urheberrechtlich geschütztes Pornografie-Material über Torrent-Netzwerke heruntergeladen, um seine KI-Modelle zu trainieren. Das Unternehmen betont, dass die Download-Aktivitäten, auf die sich die Klage stützt, lediglich für „persönliche Nutzung“ gedacht waren und keinesfalls zur Entwicklung von KI-Systemen genutzt wurden. Laut Meta handelte es sich bei den heruntergeladenen Dateien um Inhalte, die im Rahmen von internen Tests oder Forschungsprojekten im privaten Umfeld genutzt wurden, ohne dass diese jemals in KI-Trainingspipelines eingeflossen seien. Die Klage, die von einem unbekannten Anwalt eingereicht wurde, wirft Meta vor, urheberrechtlich geschützte pornografische Inhalte illegal über P2P-Netzwerke zu beschaffen, um Modelle wie Llama zu trainieren. Die Anklage basiert auf der Analyse von IP-Adressen und Download-Logs, die angeblich auf die Nutzung von Torrents durch Meta-Mitarbeiter hindeuten. Meta dementiert dies entschieden und argumentiert, dass die genutzten Netzwerke keine geeigneten Quellen für großskaliges KI-Training seien und dass die Unternehmensrichtlinien strikte Regeln gegen den Download urheberrechtlich geschützter Inhalte vorsehen. Ein internes Audit habe ergeben, dass keine der heruntergeladenen Dateien für die Entwicklung von KI-Modellen verwendet wurde, und dass alle betroffenen Downloads entweder aus dem privaten Bereich stammten oder als Teil von Sicherheits- und Compliance-Tests durchgeführt wurden. Meta betont zudem, dass es keine Beweise dafür gibt, dass urheberrechtlich geschützte Inhalte in seine KI-Modelle gelangt sind. Die Firma weist darauf hin, dass ihre KI-Trainingsdaten ausschließlich aus lizenzierbaren Quellen stammen, darunter öffentlich zugängliche Webseiten, offene Datensätze und lizenzierte Inhalte von Drittanbietern. Industrieexperten sehen die Klage als typisches Beispiel für die zunehmende Rechtsunsicherheit um KI-Trainingsdaten. Viele KI-Unternehmen, darunter auch Google, Microsoft und OpenAI, nutzen ähnliche Datenquellen, wobei die Grenze zwischen öffentlichem Zugang und Urheberrechtsverletzung oft fließend ist. Experten warnen, dass solche Klagen, selbst wenn sie nicht erfolgreich sind, erhebliche Ressourcen binden und die Innovation in der KI-Entwicklung behindern könnten. Gleichzeitig wird kritisiert, dass die Rechtslage in Bezug auf den Umgang mit Webinhalten für KI-Training noch unklar ist und dringend eine gesetzliche Regelung benötigt. Meta, ursprünglich als Facebook gegründet, ist ein globaler Technologiekonzern mit Schwerpunkt auf sozialen Medien, KI-Entwicklung und virtueller Realität. Die Firma ist mit ihren Llama-Modellen einer der führenden Akteure im Bereich offener KI. Die aktuelle Klage stellt jedoch erneut die ethische und rechtliche Verantwortung von Tech-Unternehmen bei der Nutzung von Internetinhalten in KI-Systemen in den Fokus. Obwohl Meta die Anschuldigungen ablehnt, könnte die Sache die Diskussion um Transparenz und Nachvollziehbarkeit von KI-Trainingsdaten weiter anheizen.
