微小画像変化がAIガードレールを突破
フロリダ国際大学(FIU)のハディ・アミニ准教授とMd Jueal Mia大学院生は、画像の微細なピクセル改変により人工知能(AI)の安全フィルターを回避する手法「JaiLIP」を開発し、その成果をIEEE Xploreで発表した。AIモデルが画像を数値パターンとして認識する特性を突く本手法は、損失誘導型アルゴリズムを用いて最適なピクセルノイズを算出し、モデルの意図しない有害応答やポリシー違反を誘発するトリガーとなる。BLIP-2などの多モーダルモデルでの試験では、改変画像を入力した際のエッジケース発生率がほぼ倍増し、信号機画像による交通違反の教示など、本来ブロックされるべき出力が引き出された。本研究は、中小企業がカスタマーサービスや業務効率化でAIを導入する際に直面するセキュリティ課題を浮き彫りにした。アミニ准教授は、防御が不十分なオープンソースモデルやチャットボットが信頼を損ない、新たなサイバー攻撃経路となるリスクを指摘する。同チームは自ら脆弱性を暴くレッドチームアプローチを通じて、AIが画像内の潜在的分を学習・修正する防御メカニズムの開発を推進している。専門家によれば、AIシステムへの機微画像提供の制限、アクセス権限の厳格化、導入前のセキュリティ評価が基本対策となる。本発見は、人間には視覚不可能なピクセル改ざんがAIの安全基盤を揺るがす脅威として認識される中、多モーダルAIの堅牢性向上と実装ガイドライン策定に向けた重要な知見を提供するものである。
