
要約
実世界の多くのシナリオにおいて、ラベル付きの訓練データセットは極めてクラス不均衡な状態にあり、深層ニューラルネットワークはバランスの取れたテスト基準への一般化に困難を抱える。本論文では、頻度の高いクラスから頻度の低いクラスへのサンプル(例:画像)の変換を活用して、頻度の低いクラスを拡張するという、新規かつシンプルなアプローチを提案する。この単純な手法により、多数クラスの多様性を転移・活用することで、分類器は少数クラスのより汎化性の高い特徴を学習可能となる。様々なクラス不均衡データセットを用いた実験結果から、従来のリサンプリングやリウェイト法と比較して、本手法が少数クラスにおける一般化性能を著しく向上させることを示した。さらに、本手法の性能は、従来の最先端手法をも上回る結果を示した。