
要約
視覚認識タスクにおいて顕著な進展が見られても、訓練データが不足している場合やクラス分布が極端に不均衡な場合には、深層ニューラルネットワークは依然として十分な一般化性能を発揮できず、実世界の例に対して極めて脆弱である。本論文では、この制約を緩和するため、非常にシンプルでありながら極めて有効な手法を提案する。具体的には、純粋なノイズ画像を追加の訓練データとして利用する方法である。従来のデータ拡張において用いられる加法的ノイズや敵対的ノイズとは異なり、本手法は純粋なランダムノイズ画像を直接学習データとして用いるという全く新しいアプローチを提示する。本研究では、自然画像に加えて純粋なノイズ画像の学習を可能にする新しい「分布に配慮したルーティングバッチ正規化層(Distribution-Aware Routing Batch Normalization, DAR-BN)」を提案する。この層により、同一ネットワーク内で自然画像とノイズ画像の両方を用いた学習が可能となり、一般化性能の向上と過学習の抑制が促進される。提案手法は、長尾分布を有する画像分類データセット(CIFAR-10-LT、CIFAR-100-LT、ImageNet-LT、Places-LT、CelebA-5)において、顕著な性能向上を達成し、現時点での最先端の結果を実現した。さらに、本手法は非常にシンプルで、既存のデータ拡張手法に追加する一般的な拡張ツールとして容易に利用可能であり、あらゆる学習スキームに組み込むことができる。特別なデータ生成プロセスや訓練手順を必要としないため、学習の高速性と効率性を維持しつつ、実用性の高い新しいアプローチを提供する。