17日前

BIGRoC:ロバストな分類器を活用した画像生成の向上

Roy Ganz, Michael Elad
BIGRoC:ロバストな分類器を活用した画像生成の向上
要約

近年、機械学習コミュニティにおける画像合成への関心が著しく高まっており、多様な深層生成モデルおよびそれらの学習手法が登場している。本研究では、任意の生成モデルによって得られる画像の品質および分布忠実度を向上させる、汎用的かつモデル非依存の手法を提案する。本手法は「BIGRoC(Robust Classifierを用いた画像生成の強化)」と呼ばれ、生成モデルの追加学習を必要とせず、与えられたロバストな分類器のガイドラインに基づく後処理プロセスに依拠している。合成された画像に対して、ロバスト分類器を用いた射影勾配ステップを繰り返し適用することで、その識別精度を高める更新処理を提案する。我々は、CIFAR-10およびImageNetにおいて、様々な画像合成手法に対してこの後処理アルゴリズムを適用し、定量的・定性的に顕著な改善を示した。驚くべきことに、BIGRoCは精緻化手法の中で初めてモデル非依存である一方で、必要な情報量も極めて少なく、既存の競合手法を上回る性能を達成した。具体的には、ImageNet 128×128における最良性能を発揮する拡散モデルに対して14.81%の向上を実現し、FIDスコアを2.53まで改善した。また、256×256サイズでは7.87%の向上により、FIDスコア3.63を達成した。さらに、人間の評価調査を実施した結果、参加者により本手法の出力が顕著に好まれることが明らかになった。