Creative Commons startet CC signals für offenere AI-Daten nutzen
Creative Commons startet CC Signals, ein Rahmenwerk für ein offenes KI-Ökosystem Die gemeinnützige Organisation Creative Commons, die die Lizenzbewegung ins Leben gerufen hat, die Schaffenden ermöglicht, ihre Werke zu teilen, während sie urheberrechtliche Rechte behalten, bereitet sich nun auf das Zeitalter der künstlichen Intelligenz (KI) vor. Mittwoch kündigte Creative Commons das Launching eines neuen Projekts namens CC Signals an. Dieses Projekt soll es Datenbankverwaltern ermöglichen, detailliert zu definieren, wie ihre Inhalte von Maschinen, zum Beispiel zur Ausbildung von KI-Modellen, verwendet oder nicht verwendet werden dürfen. Das Ziel des CC Signals Projekts besteht darin, einen Ausgleich zwischen dem offenen Charakter des Internets und der wachsenden Nachfrage nach Daten zu schaffen, die KI-Systeme antreiben. Wie Creative Commons in einem Blogbeitrag erklärt, könnte die fortlaufende Datenauswertung die Offenheit im Internet untergraben und Anbieter dazu veranlassen, ihre Websites abzuschirmen oder mit Paywalls zu versehen, anstatt freien Zugang zu ihren Daten zu gewähren. Um eine Lösung für dieses Problem zu bieten, zielt CC Signals darauf ab, ein rechtliches und technisches Rahmenwerk zu schaffen, das den Austausch von Daten fördern soll. Dieses Rahmenwerk ist für diejenigen gedacht, die die Daten kontrollieren, und diejenigen, die diese Daten zur Ausbildung von KI nutzen. Die Nachfrage nach solchen Werkzeugen steigt, da Unternehmen ihre Nutzungsbedingungen ändern müssen, um entweder die Ausbildung von KI mit ihren Daten zu begrenzen oder zu erklären, in welchem Umfang sie Benutzerdaten für KI-zugehörige Zwecke verwenden werden. Ein Beispiel hierfür ist die Plattform X, die ursprünglich eine Änderung vorgenommen hatte, die Dritten erlaubte, ihre öffentlichen Daten für die Ausbildung von Modellen zu nutzen, diese Entscheidung jedoch später wieder rückgängig gemacht hat. Reddit nutzt seine robots.txt-Datei, die ursprünglich automatisierten Web-Crawlers sagen sollte, ob sie auf der Website zugreifen dürfen, um Bots daran zu hindern, Daten für die KI-Ausbildung zu scrapen. Cloudflare plant, eine Lösung zu entwickeln, bei der KI-Bots für das Scraping bezahlen müssen, sowie Werkzeuge, die diese verwirren sollen. Auch Open-Source-Entwickler haben Werkzeuge gebaut, um die Ressourcen von KI-Crawlers zu verlangsamen und zu verschwenden, die ihre „kein Scraping“-Richtlinien nicht respektierten. Im Gegensatz dazu bietet das CC Signals-Projekt eine alternative Lösung: eine Reihe von Werkzeugen, die verschiedene Grade der rechtlichen Durchsetzbarkeit bieten, aber alle ethisch gewichtig sind, ähnlich wie die CC-Lizenzen, die heute Milliarden von lizenzfreien kreativen Werken online abdecken. „CC Signals sind darauf ausgelegt, die Gemeinschaft im Zeitalter der KI zu erhalten“, sagte Anna Tumadóttir, CEO von Creative Commons, in einer Ankündigung. „Genauso wie die CC-Lizenzen beim Aufbau des offenen Webs geholfen haben, glauben wir, dass CC Signals dazu beitragen werden, ein offenes KI-Ökosystem zu formen, das auf Gegenseitigkeit basiert.“ Das Projekt befindet sich noch in den Anfängen. Frühe Designs wurden auf der CC-Website und dem GitHub-Seiten veröffentlicht. Die Organisation sucht aktiv öffentliche Rückmeldungen, bevor es im November 2025 zu einem Alpha-Launch (früher Test) kommen soll. Es wird auch eine Reihe von Town Halls veranstaltet, um Feedback und Fragen zu sammeln. Branchenexperten begrüßen die Initiative von Creative Commons als wichtigen Schritt in Richtung eines ethisch und rechtlich fundierten Umgangs mit Daten im KI-Zeitalter. Sie sehen in CC Signals das Potenzial, sowohl die Interessen der Datenanbieter als auch die der KI-Forscher zu schützen und gleichzeitig die Offenheit des Internets zu bewahren. Creative Commons, gegründet 2001, ist bekannt für seine visionären Beiträge zur digitalen Rechtswelt und hat sich seit Beginn darauf konzentriert, innovative Lösungen für urheberrechtliche Herausforderungen zu finden.