US-Regierung und Anthropic legen KI-Sicherheitsregeln fest
Das Weiße Haus und das KI-Unternehmen Anthropic arbeiten an einem gemeinsamen Regelwerk zur Bewertung von Sicherheitslücken in fortschrittlichen Sprachmodellen. Hintergrund sind aktuelle Exportbeschränkungen durch die US-Regierung, die den Zugang zu Anthropics neuesten Modellen Fable 5 und Mythos 5 für ausländische Nutzer aussetzen ließ. Die Maßnahme folgte auf einen bekannten Jailbreak, bei dem integrierte Sicherheitsvorkehrungen umgangen wurden. Während sich die Regierung und der Anthropic-Chef Dario Amodei unterschiedlich zur Schwere des Vorfalls äußerten, haben sich die Verhandlungen nun von einer konfrontativen Auseinandersetzung hin zur Entwicklung technischer Standards verlagert. Die Gespräche, geleitet auf Seiten von Anthropic durch die Leiterin für öffentliche Angelegenheiten Sarah Heck und den Mitgründer Tom Brown, sowie auf Regierungsseite durch Handelsminister Howard Lutnick und den Nationalen Cybersicherheitsdirektor Sean Cairncross, zielen auf die Etablierung einheitlicher Prüfkriterien ab. Diese sollen künftig verwendet werden, um derartige Vorfälle systematisch zu bewerten. Kern der geplanten Benchmarks sind die Frage, inwieweit Schutzmechanismen umgangen wurden, welche Fähigkeiten dadurch freigelegt werden und welche praktischen Auswirkungen ein Sicherheitsvorfall hat. Die Verhandlungen finden vor dem Hintergrund der G7-Treffen in Frankreich statt, auf denen sich führende Technologieunternehmen und Staatsführer ebenfalls über notwendige Sicherheitsrahmen für KI ausgetauscht haben. Ein zentrales Verständnis in den Diskussionen ist, dass kein KI-System vollständig vor Manipulationen gefeit ist. Die US-Regierung erkennt zunehmend an, dass eine pauschale Deaktivierung von Modellen bei jedem Sicherheitsvorfall nicht praktikabel ist und stattdessen klare, messbare Richtlinien erforderlich sind, um Risiken einzuordnen und gegebenenfalls staatliche Eingriffe zu rechtfertigen. Nach einem vorübergehenden Zusammenbruch der Verhandlungen am vergangenen Freitag, als Anthropic die Forderung nach einer erneuten Deaktivierung von Fable ablehnte, haben intensive Telefonkonferenzen am Wochenende und anschließende Treffen in Washington einen konstruktiven Weg geebnet. Anthropic hat zudem eigene Forschende und Expertinnen für Sicherheitsvorkehrungen an das Handelsministerium entsandt, um gemeinsam an konkreten Lösungsansätzen zu arbeiten. Die Exportbeschränkungen bestehen weiterhin, doch die Verschiebung hin zur Normungsarbeit signalisiert einen deutlichen Fortschritt in der Regulierungsdiskussion. Das geplante Framework soll nicht nur aktuelle Konflikte bereinigen, sondern als Blaupause für die künftige Aufsicht über Hochrisiko-KI dienen. Damit reagiert die US-Regierung auf die Erkenntnis, dass die technologische Entwicklung den behördlichen Prüfungsstrukturen deutlich voraus ist. Die standardisierte Bewertung von Sicherheitslücken könnte künftig sowohl nationalen wie internationalen Marktzugriff regeln und gleichzeitig Innovationen innerhalb klar definierter Sicherheitsgrenzen ermöglichen. Die Ergebnisse der laufenden Arbeiten werden als möglicher Ausgangspunkt für künftige globale KI-Sicherheitsstandards gewertet.
