11日前
UniformAugment:検索不要な確率的データ拡張手法
Tom Ching LingChen, Ava Khonsari, Amirreza Lashkari, Mina Rafi Nazari, Jaspreet Singh Sambee, Mario A. Nascimento

要約
トレーニングデータセットの拡張は、複数のコンピュータビジョンタスクにおいて学習効果の向上が示されている。優れた拡張手法は、元のデータセットの統計的性質を保持しつつ、データの多様性を増加させる拡張データセットを生成する。AutoAugmentやFast AutoAugmentなどの手法は、特定のモデルとデータセットに適した拡張ポリシーのセットを探索するフェーズを導入しているが、これには膨大な計算負荷が伴い、最大数千時間に及ぶGPU時間が必要となる。近年、RandAugmentが提案され、拡張空間を少数のハイパーパラメータで近似することで探索フェーズを大幅に高速化したが、それでもこれらのハイパーパラメータのチューニングに無視できないコストがかかる。本論文では、拡張空間が近似的に分布不変であるという仮定の下で、拡張変換の連続空間上で一様にサンプリングするだけで、高効果なモデルの学習が可能であることを示す。この結果を基に、探索フェーズを完全に回避する自動データ拡張手法UniformAugmentを提案する。理論的裏付けについて議論する一方で、標準的なデータセットおよび画像分類に用いられる既存のモデルを用いて、UniformAugmentの有効性が前述の手法と同等であることを実証する。さらに、探索フェーズを必要としないため、極めて効率的な性能を発揮することも示す。