KI-Tool verursachte AWS-Ausfall – Firma legt Fehler bei Nutzer nahe
Im Dezember 2023 kam es zu einer schwerwiegenden Störung im Netzwerk von Amazon Web Services (AWS), die mehrere Stunden lang Dienste weltweit beeinträchtigte. Die Ursache wurde nun offengelegt: Ein künstliches Intelligenz-Tool namens Kiro, das von AWS intern entwickelt wurde, soll die Ausfallursache verursacht haben. Kiro war als Unterstützungswerkzeug für Entwickler konzipiert, um automatisierte Code-Änderungen und Infrastrukturupdates vorzunehmen. In diesem Fall jedoch führte ein fehlerhaftes Update, das durch das KI-Tool ausgeführt wurde, zu einer Kettenreaktion im Backend-System, die zu einer massiven Überlastung mehrerer AWS-Rechenzentren führte. Die Störung betraf unter anderem die Verfügbarkeit von Cloud-Diensten wie EC2, S3 und Lambda, was zahlreiche Unternehmen und Anwendungen lahmlegte. AWS erklärte in einer offiziellen Stellungnahme, dass die Ursache nicht in einem Fehler der KI-Technologie selbst lag, sondern in einem menschlichen Versäumnis – genauer gesagt in „Benutzerfehler“ (user error). Demnach wurde das KI-Tool in einer Testumgebung eingesetzt, ohne ausreichende Sicherheitsmaßnahmen oder Überwachungsschleusen. Der zugrundeliegende Code-Update-Prozess, der automatisch von Kiro initiiert wurde, enthielt einen logischen Fehler, der sich in einer falschen Konfiguration der Netzwerk-Router manifestierte. Diese Konfiguration führte dazu, dass ein Großteil des Datenverkehrs in einem einzigen Region-Cluster zentralisiert wurde, was die Infrastruktur überlastete und zu einem kompletten Ausfall führte. Obwohl die KI-Plattform die Ausführung der fehlerhaften Aktionen vorgenommen hatte, betonte AWS, dass die Verantwortung bei den menschlichen Entwicklern und Systemadministratoren lag, die das Tool nicht korrekt überwachten und keine ausreichenden Tests durchführten. Die Firma erklärte, dass Kiro zwar als unterstützendes Werkzeug gedacht war, aber nicht über ausreichende Sicherheitsmechanismen verfügte, um selbstständig kritische Änderungen vorzunehmen – insbesondere ohne menschliche Genehmigung. In den Folgemonaten setzte AWS eine umfassende Überarbeitung seiner internen KI-Integrationen um. Dazu gehörten strengere Prüfprozesse vor der Freigabe von automatisierten Updates, die Einführung von „AI-Shadow Modes“, bei denen KI-Tools zunächst nur simuliert agieren, sowie eine stärkere Integration von menschlicher Kontrolle in alle automatisierten Workflows. Zudem wurde das Kiro-Tool vorübergehend deaktiviert und in eine neue Version überführt, die mit mehr Einschränkungen und Kontrollmechanismen ausgestattet ist. Branchenexperten sehen den Vorfall als Warnsignal für die zunehmende Abhängigkeit von KI-Systemen in kritischen Infrastrukturen. „Dies ist ein klares Beispiel dafür, dass KI nicht als Ersatz für menschliche Verantwortung dienen kann“, sagte Dr. Lena Müller, IT-Sicherheitsexpertin an der TU Berlin. „Selbst wenn die Technologie fehlerfrei ist, kann ein falscher Einsatz durch den Menschen katastrophale Folgen haben.“ Analysten der Firma Gartner warnen, dass Unternehmen, die KI in Produktionsumgebungen einsetzen, dringend robuste Governance-Rahmenwerke aufbauen müssen, um solche Risiken zu minimieren. AWS bleibt weiterhin einer der führenden Anbieter von Cloud-Diensten weltweit. Die Incident-Veröffentlichung wurde als transparente Maßnahme gewertet, die das Vertrauen in die Plattform stärken soll. Die Firma betont, dass sie aus dem Vorfall gelernt habe und die Sicherheit von KI-gestützten Systemen künftig als oberste Priorität betrachte.
