新AIモデル、少量学習で偽画像検出
ワシントン大学セントルイス校とオークリッジ国立研究所の研究者チームは、生成AI画像の偽造検出を目的とした新モデルSimLBRを開発した。同モデルはIEEE/CVFコンピュータビジョン・パターン認識学会で発表され、arXivにプレプリントが公開された。主査研究者のアーユシュ・ダカル博士課程学生とナーサン・ジェイコブズ教授率いる研究室が中心となり、従来の偽物検出手法の課題を解決するアプローチを実現した。 SimLBRの特徴は、画像生成AIではなく本物の画像の学習に焦点を当てている点にある。高次元のピクセルデータを基盤モデルを用いて1024次元の潜在空間に圧縮し、この空間内で本物の画像分布を学習する。訓練時に偽ラベルを割り当てた実画像に対し、少量の偽画像情報を潜在空間でブレンドする正則化手法を適用することで、本物画像の分布を明確な境界で囲み、未知の生成モデルへの泛化能力を向上させる。 計算資源の効率化も同モデルの主要な利点である。単一GPU環境で学習時間が3分未満に収まるため、従来手法の8GPU・2時間という条件を大幅に上回る。これによりコスト削減が可能となり、限られた環境でも高効率に検証を行える環境を整備した。 評価手法として、研究者チームは信頼性と最悪ケース性能の2指標を提案した。信頼性は高精度かつ低不確実性を示し、未知の生成モデルに対して検出器がどの程度安定して機能するかの基準となる。最悪ケース性能は、訓練データと異なる未来の生成モデルが登場した際の検出精度の下限を示す。これにより、特定の生成アルゴリズムに依存せず、実画像分布からの逸脱を検出する汎用性の高い検出器を実現している。 本研究は、生成AIの進化が停滞せず人間による目視確認が将来的に不可能になる可能性がある現状を踏まえ、防御側の技術的優位を確保する方針を提示した。同モデルはSNSやウェブ上に流出する新型生成画像に対する検出精度の向上に寄与し、深層学習分野における画像真正性検証の新たな基準となり得ると期待されている。
