17日前
シナリオに依存しないミックスアップを用いた識別的視覚表現学習の強化
Siyuan Li, Zicheng Liu, Zedong Wang, Di Wu, Zihan Liu, Stan Z. Li

要約
Mixupは、深層ニューラルネットワーク(DNN)における代表的なデータ依存型拡張手法として広く知られており、主に2つのサブタスクから構成される:mixupサンプルの生成と分類。しかし、近年の主流となるオンライン学習手法では、mixupが監視学習(SL)に限定され、生成タスクの目的関数が全データ多様体全体ではなく、特定のサンプルペアに限定されているため、自明な解が生じる可能性がある。このような制約を克服するため、本研究ではmixup生成の目的関数を包括的に検討し、監視学習(SL)および自己教師学習(SSL)の両シナリオに対応するScenario-Agnostic Mixup(SAMix)を提案する。具体的には、混合された2クラス間の局所的な滑らかさを最適化しつつ、他のクラスとのグローバルな識別性を保つという目的関数を仮説として提示し、実証的に検証した。これに基づき、2つの目的関数を補完的に学習するための$η$-バランス化mixup損失関数を提案する。同時に、ラベルを必要としない生成用サブネットワークを設計することで、非自明なmixupサンプルを効果的に生成し、汎化能力を向上させた。さらに、オンライン学習における計算コストを削減するため、事前学習済みバージョンであるSAMix$^\mathcal{P}$を導入し、より優れた効率性と汎化性能を実現した。9つのSLおよびSSLベンチマークにおける広範な実験により、SAMixが従来手法と比較して一貫した優位性と高い汎用性を示したことが確認された。