18日前

SnapMix: ファイングレインデータの拡張のための意味論的割合混合

Shaoli Huang, Xinchao Wang, Dacheng Tao
SnapMix: ファイングレインデータの拡張のための意味論的割合混合
要約

データミキシング増強は、深層モデルの学習において有効であることが実証されている。近年の手法では、画像ピクセルの混合割合に基づいてラベルを混合するものが主流である。しかし、細粒度画像の主な識別情報は微細な領域に集中するため、このようなアプローチは細粒度認識において顕著なラベルノイズを引き起こしやすい。本論文では、クラス活性マップ(CAM)を活用して細粒度データの増強におけるラベルノイズを低減する新しい手法、Semantically Proportional Mixing(SnapMix)を提案する。SnapMixは、混合画像の内在的な意味的構成を推定することで、対応するターゲットラベルを生成し、非対称な混合操作を可能にするとともに、合成画像とターゲットラベルの間の意味的整合性を保証する。実験結果から、本手法はさまざまなデータセットおよび異なるネットワーク深度において、既存の混合ベース手法を一貫して上回ることが明らかになった。さらに、中間層特徴を組み込むことで、トップレベルの性能を達成しており、細粒度認識における堅牢なベースラインとしての可能性を示している。本研究のコードは、https://github.com/Shaoli-Huang/SnapMix.git にて公開されている。

SnapMix: ファイングレインデータの拡張のための意味論的割合混合 | 最新論文 | HyperAI超神経