HyperAIHyperAI

Command Palette

Search for a command to run...

Cloudflare-Ausfall: Bot-Management-Update stürzte System ab

Am Dienstag kam es zu einer erheblichen Störung im Cloudflare-Netzwerk, die mehrere Stunden lang zahlreiche Online-Dienste wie ChatGPT, X (ehemals Twitter) und der Ausfall-Tracker Downdetector lahmlegte. Cloudflare, das nach eigenen Angaben etwa 20 Prozent des globalen Web-Verkehrs über seine Infrastruktur verarbeitet, erklärte, dass die Ursache keine Cyberattacke, kein DNS-Fehler und auch nicht die neu eingeführte KI-basierte Bot-Abwehr „AI Labyrinth“ war. Stattdessen lag der Ausfall an einer veränderten Datenbankabfrage im zugrundeliegenden ClickHouse-System. Die Störung entstand durch eine Änderung im Berechtigungssystem einer Datenbank, die die Konfigurationsdatei für das Bot-Management-System beeinflusste. Diese Datei, die von einem maschinellen Lernmodell generiert wird, soll automatisierte Anfragen – wie solche von KI-Crawlern – identifizieren. Durch die Änderung im Query-Verhalten wurden jedoch zahlreiche doppelte „Features“ erzeugt, was dazu führte, dass die Datei exponentiell an Größe wuchs und die vorgegebenen Speicherlimits überschritt. Als Folge stürzte der zentrale Proxy-Service aus, der für die Verarbeitung von Anfragen zuständig ist, insbesondere für Kunden, die die Bot-Scoring-Funktion nutzten. Dadurch wurden viele legitime Nutzeranfragen fälschlicherweise als Bots klassifiziert und blockiert – ein sogenannter „false positive“-Effekt. Unternehmen, die auf die automatisierte Bot-Identifikation setzten, wurden dadurch komplett offline, während Kunden, die die Bot-Scoring-Regeln nicht nutzten, unbeeinflusst blieben. Cloudflare arbeitete mit Hochdruck an der Wiederherstellung und stellte die Störung schließlich innerhalb mehrerer Stunden behebt. Die Firma betonte, dass die KI-Technologie hinter dem „AI Labyrinth“ nicht betroffen war und die Störung ausschließlich auf technische Fehlkonfigurationen im Datenbank-System zurückzuführen sei. In der Branche wurde die Störung als eindrucksvolles Beispiel für die Anfälligkeit globaler Cloud-Infrastrukturen interpretiert. Experten weisen darauf hin, dass selbst hochentwickelte Systeme mit KI-Unterstützung anfällig für unerwartete Auswirkungen von Code-Änderungen sind, insbesondere wenn sie in kritischen, skalierbaren Systemen eingesetzt werden. Cloudflare, gegründet 2009 und mit Sitz in San Francisco, ist ein führender Anbieter von Netzwerkdiensten, der Schutz vor DDoS-Angriffen, Content Delivery und Sicherheit für Webseiten anbietet. Die jüngste Störung unterstreicht die Notwendigkeit strenger Test- und Rollback-Strategien, besonders bei Systemen, die kritische Teile des Internets betreiben.

Verwandte Links

Cloudflare-Ausfall: Bot-Management-Update stürzte System ab | Aktuelle Beiträge | HyperAI