2ヶ月前

より詳細に見る前に更好地見ること:細部視覚分類のための弱教師ありデータ拡張ネットワーク

Tao Hu; Honggang Qi; Qingming Huang; Yan Lu
より詳細に見る前に更好地見ること:細部視覚分類のための弱教師ありデータ拡張ネットワーク
要約

データ拡張は通常、訓練データの量を増やし、過学習を防ぎ、深層モデルの性能を向上させるために採用されます。しかし、実際にはランダムなデータ拡張(例えばランダムな画像切り取り)が効率が低く、多くの制御不能な背景ノイズを導入する可能性があります。本論文では、データ拡張の潜在能力を探るため、弱教師ありデータ拡張ネットワーク(Weakly Supervised Data Augmentation Network: WS-DAN)を提案します。具体的には、各訓練画像に対してまず弱教師あり学習により物体の識別的な部分を表現する注目マップを生成します。次に、これらの注目マップに基づいて画像を拡張します。これには注目領域の切り取りと注目領域の除去が含まれます。提案されたWS-DANは分類精度を二つの面で向上させます。第一段階では、より識別的な部分の特徴が抽出されるため、画像がよりよく認識できるようになります。第二段階では、注目領域が物体の正確な位置情報を提供し、モデルが物体にさらに近づいて観察することを保証し、性能のさらなる向上につながります。一般的な細分化視覚分類データセットでの包括的な実験結果は、WS-DANが最先端の手法を超えることを示しており、その有効性を証明しています。