RandAugment:制限された探索空間を有する実用的な自動データ拡張

最近の研究では、データ拡張が深層学習モデルの一般化性能を著しく向上させる可能性があることが示されている。特に、自動化された拡張戦略は、画像分類および物体検出において、最先端の結果を達成している。これらの戦略は、検証精度の向上を最適化するように設計されてきたが、半教師あり学習においても最先端の性能を達成し、画像の一般的な劣化(corruptions)に対するロバスト性も向上させている。しかし、これらの手法の広範な導入を阻む要因として、別途拡張戦略の探索フェーズが必要となる点がある。この探索フェーズは訓練の複雑性を増加させ、計算コストを大幅に引き上げる可能性がある。さらに、探索フェーズが独立しているため、モデルやデータセットのサイズに応じて正則化の強度を動的に調整することができない。従来の自動拡張戦略は、小規模なモデルと小規模なデータセットで訓練を行い、その結果得られた戦略を大規模なモデルに適用するというアプローチが一般的である。本研究では、この二つの課題を同時に克服する。RandAugmentは、探索空間を大幅に削減しており、ターゲットタスク上で直接訓練可能であり、別途代理タスク(proxy task)を用いた探索フェーズが不要となる。さらに、パラメータ化された設計により、モデルやデータセットのサイズに応じて正則化の強度を柔軟に調整できる。RandAugmentは、さまざまなタスクやデータセットに一貫して適用可能であり、出荷時から即座に使用可能であり、CIFAR-10/100、SVHN、ImageNetにおいて、これまでのすべての自動拡張手法を同等または上回る性能を達成している。ImageNetでは85.0%の精度を達成し、前人最高の結果より0.6%向上、ベースラインの拡張手法より1.0%向上した。物体検出においても、ベースライン拡張手法に対して1.0~1.3%の性能向上を実現し、COCOデータセットにおいてAutoAugmentのmAPからわずか0.3%以内の差にとどまっている。最後に、解釈可能なハイパーパラメータを持つことから、モデルやデータセットのサイズを変化させた際のデータ拡張の役割を調査する手段としても有効である。コードはオンラインで公開されている。