HyperAIHyperAI

Command Palette

Search for a command to run...

Cloudflareのデータベース誤設定が世界中サービスを一時停止、ChatGPTも影響

Cloudflareが、2024年3月19日に発生した大規模なサービス障害について説明した。この障害により、X(旧Twitter)、ChatGPT、ダウンタイム追跡サービスのDowndetectorなどが数時間にわたり利用不能となった。Cloudflareは前年、世界のウェブの約20%が自社ネットワークを通じて運用されていると公表しており、通常はトラフィックの急増やDDoS攻撃に対しても負荷分散によりサービスの安定を維持している。 今回の障害の原因は、生成AIを活用したボット対策システムの一部ではなく、データベースの権限設定に関する変更に起因した。Cloudflareは当初、サイバー攻撃やハイパーディスラプティブなDDoS攻撃を疑っていたが、後にそれは否定された。 具体的には、ボット管理システム「Bot Management」の動作を支える機械学習モデルが使用する設定ファイルの生成プロセスに問題が発生した。このファイルは、クリックハウス(ClickHouse)データベース上で実行されるクエリによって作成され、自動化されたリクエスト(ボット)を識別するための「特徴」データを含んでいた。しかし、あるクエリの挙動変更により、このファイルに大量の重複した「特徴」行が生成され、メモリ制限を超える規模に膨張した。 その結果、ボットモジュールに依存するトラフィック処理のコアプロキシシステムがダウンし、Cloudflareの顧客の多くがサービスを提供できなくなった。特に、ボットスコアを用いてリクエストをブロックするルールを設定していた企業は、誤って正当なユーザーのアクセスも遮断する「誤検出」が発生。一方、ボットスコアを活用していなかった顧客は正常にサービスを維持できた。 Cloudflareは、生成AIを用いた新技術「AIラビリンス」が原因ではないと明言。同技術は、AIクローラーのリソースを無駄に消費するための対策として、AI生成コンテンツで混乱を引き起こす仕組みを採用しているが、今回の障害とは無関係である。 この事例は、AIを活用するセキュリティインフラの複雑さと、一見無害に見えるシステム変更が大規模な影響を及ぼす可能性を浮き彫りにしている。

関連リンク

Cloudflareのデータベース誤設定が世界中サービスを一時停止、ChatGPTも影響 | 人気の記事 | HyperAI超神経