17日前

Few-Shot学習のための伝達的情報最大化

Malik Boudiaf, Ziko Imtiaz Masud, Jérôme Rony, José Dolz, Pablo Piantanida, Ismail Ben Ayed
Few-Shot学習のための伝達的情報最大化
要約

少量学習におけるトランスダクティブ情報最大化(Transductive Information Maximization; TIM)を提案する。本手法は、与えられた少量学習タスクにおいて、クエリ特徴量とそのラベル予測との間の相互情報量を最大化するとともに、サポートセットに基づく教師信号損失を併用する。さらに、相互情報量損失に対して新たな交替方向法(alternating-direction solver)を提案し、勾配ベースの最適化に比べてトランスダクティブ推論の収束を大幅に高速化しつつ、同等の精度を達成している。TIMの推論はモジュール構造を採用しており、任意のベース学習用特徴抽出器の上に適用可能である。標準的なトランスダクティブ少量学習設定に基づく包括的な実験により、ベースクラスに対して単純な交差エントロピーで事前学習された固定特徴抽出器を用いながら、複雑なメタラーニングスキームを用いずに、様々なデータセットおよびネットワーク構造において最先端手法を顕著に上回ることを示した。特に、既に確立された少量学習ベンチマークだけでなく、ドメインシフトやクラス数の増加といったより困難なシナリオにおいても、最も優れた既存手法に対して2%~5%の精度向上を一貫して達成している。