HyperAI超神経
Back to Headlines

NVIDIA GPU向け新攻撃「GPUHammer」、GDDR6メモリ上のAIモデルを壊す危険性

2日前

GPUHammer攻撃、NVIDIA GDDR6搭載カードのAIモデルを静かに破壊 研究者が新たな攻撃手法「GPUHammer」を発見し、NVIDIA GPUのメモリ内のビットを反転させ、AIモデルを静かに破壊できることが明らかになった。この攻撃はコードまたはデータ入力に直接アクセスすることなく、重大な被害を及ぼす可能性がある。幸いにも、NVIDIAは既にリスク緩和のためにガイドラインを公表しているが、特にGDDR6 VRAMを搭載したカードを使用しているユーザーにとっては注意が必要だ。 GPUHammerはRowhammerという既知のハードウェア問題のGPU版である。Rowhammerは、CPUとRAMの世界で長年問題となっている。現代のメモリチップは sangat 密接に組み合わされているため、特定の行に対して反復して読み書きを行うと、隣接する行に電気干渉が生じ、ビットが反転することがある。これらの反転したビットは数字、コマンド、またはニューラルネットワークの重みなどの何でもあり、これが問題の根本となる。 攻撃の詳細 この攻撃は、NVIDIA RTX A6000で実証された。研究チームは、GDDR6 VRAMの特定のメモリセルを反復して操作することで、周辺のビットを反転させ、格納されているデータに干渉する方法を示した。たった一つのビット反転により、AIモデルの精度は80%から1%以下にまで低下した。安全性に対する保障がある場合でも、複数のビット反転が複数のメモリバンクで起こり、訓練されたAIモデルを完全に無力化させることができる。 GPUHammerのリスクは、特に workstation とサーバー用途で使用される Ampere, Ada, Hopper, および Turing シリーズのGPUに影響を及ぼす。NVIDIAは影響を受けるモデルのリストを公開し、ECC(エラー訂正符号)の使用を推奦している。最新のGPUでは、RTX 5090やH100のように、チップ自体にECCが内蔵されており、ユーザーによる設定不要で自動的に動作する。 問題の範囲と影響 個人のゲーマーや自宅での使用にはあまり関係ないが、共有GPU環境では大きな問題になる。クラウドゲーミングサーバーやAIトレーニングクラスタ、複数のユーザーが同じハードウェア上でワークロードを実行するVDIセットアップなどが該当する。これらの環境では、攻撃者は同じGPUを共有するだけで、他のユーザーのワークロードに任意の干渉を行える。 NVIDIAの対応 NVIDIAはECCの有効化を簡潔に推奨している。ECCはメモリに冗長性を追加し、ビット反転などのエラーを検出して修正する機能を持つ。ただし、ECCを有効にすると機械学習タスクのパフォーマンスは約10%低下し、使用可能なVRAMも6~6.5%減る。しかし、深刻なAIワークに安心を求めるなら、この-tradeoff-は避けて通れない。 ECCを有効にするには、以下のNVIDIAのコマンドラインツールを使用する: nvidia-smi -e 1 ECCが有効かどうかを確認するには: nvidia-smi -q | grep ECC より広範な影響 GPUHammerはシステムをクラッシュさせるだけでなく、AIそのものの整合性に干渉し、モデルの行動や決定に影響を与える。ハードウェアレベルで行われるため、これらの変更は特別に注目しない限りほとんど見えない。医療、金融、自動車運転支援など規制の多い業界では、誤った決定やセキュリティ違反、法的問題につながるおそれがある。 全体として、GPUのメモリ安全性はゲーム以外のAI、クリエイティブワーク、生産性への拡大に伴いますます重要となっている。GPUHammerは全産業にとって覚醒の瞬間であり、ハードウェアレベルの安全性を確保することが必須であることを再認識させるものだ。 業界からの反応と会社概要 業界関係者は、この問題がAIの信頼性に直接影響を与える可能性があると警鐘を鳴らしている。特に、共有GPUを使用する企業や組織はすぐにECCを有効にすべきだと主張している。NVIDIAは世界的な半導体設計企業であり、AI、深度学習、画像処理などの分野で先進的な製品を提供している。此次の一連の対応は、同社の迅速さと技術力を示している。

Related Links