
要約
近年、自動増強(automatic augmentation)手法は視覚タスクにおける強力なモデル性能を支える重要な柱となってきている。既存の自動増強手法は、単純さ、コスト、性能の間でトレードオフを余儀なくされることが一般的であるが、本研究ではパラメータを一切必要とせず、各画像に単一の増強操作を適用するという極めてシンプルなベースライン手法、TrivialAugmentを提示する。この手法は、ほぼコストをかけずに、従来の手法を上回る性能を達成している。その効果の高さは著者自身にとって予想外であったため、その性能を徹底的に検証するための広範な実験を行った。まず、多様な画像分類シナリオにおいてTrivialAugmentを従来の最先端手法と比較した。次に、異なる増強空間、増強手法、実験設定を用いた複数のアブレーションスタディを通じて、その性能を発揮する上で重要な要件を解明した。さらに、自動増強手法の広範な導入を容易にするシンプルなインターフェースと、再現性を確保するための完全なコードベースを公開している。本研究が自動増強分野の多くの側面における停滞を明らかにしたことを踏まえ、今後の持続的な進展を促すためのベストプラクティスの提案を結論として示す。