17日前
MaGNET:再訓練なしで深層生成ネットワーク多様体からの一様サンプリング
Ahmed Imtiaz Humayun, Randall Balestriero, Richard Baraniuk

要約
深層生成ネットワーク(DGNs)は、生成対抗ネットワーク(GANs)、変分自己符号化器(VAEs)およびその変種において、データ多様体および分布の近似に広く用いられている。しかし、収集コストや利便性の関係から、訓練サンプルは多様体上に非一様に分布することが多い。例えば、CelebAデータセットには笑顔の顔画像が多数含まれている。このような不均一性は、学習済みのDGNからサンプリングを行う際に再現され、公平性やデータ拡張の観点からは望ましくない場合がある。こうした問題に対応して、我々は、あらゆる事前学習済みDGNに対して適用可能な、理論的根拠を備えた潜在空間サンプラー「MaGNET」を提案する。MaGNETは学習された多様体上でサンプルを一様に生成する。我々は、様々なデータセットおよびDGN(例:FFHQデータセットで学習された最先端のStyleGAN2)を対象に多数の実験を実施した。その結果、MaGNETによる一様サンプリングにより、分布の精度(precision)と再現率(recall)がそれぞれ4.1%および3.0%向上し、性別バイアスは41.2%低減された。この改善はラベル情報の利用や再学習を必要としなかった。一方、一様分布は一様な意味的分布を意味するわけではないため、MaGNETによるサンプリング下で生成されたサンプルの意味的属性の変化についても、別途検討を行った。