9日前

自己教師付きの多様なエキスパートの集約によるテスト非依存な長尾認識

Yifan Zhang, Bryan Hooi, Lanqing Hong, Jiashi Feng
自己教師付きの多様なエキスパートの集約によるテスト非依存な長尾認識
要約

従来の長尾認識手法は、長尾データからクラスバランスの取れたモデルを学習することを目的としており、一般的にモデルの評価は均一なテストクラス分布を仮定している。しかし、実際のテストクラス分布はこの仮定を満たさないことが多く(例えば、長尾分布であるか、あるいは逆長尾分布である場合もある)、その結果、従来の手法は実応用において失敗する可能性がある。本論文では、より実用的でありながらも挑戦的なタスクである「テスト不特定長尾認識(test-agnostic long-tailed recognition)」に着目する。このタスクでは、学習時のクラス分布は長尾であるが、テスト時のクラス分布は不特定であり、必ずしも均一であるとは限らない。クラス不均衡という問題に加え、このタスクは学習データとテストデータ間のクラス分布シフトが未知であるという新たな課題をもたらす。この課題に対処するため、本研究では「自己教師付き多様なエキスパートの集約(Self-supervised Aggregation of Diverse Experts, SADE)」という新たなアプローチを提案する。本手法は以下の2つの戦略から構成される:(i) 単一の固定された長尾データセットから、異なるクラス分布に対応できる複数のエキスパートを別々に学習する、新しいスキル多様性を考慮したエキスパート学習戦略;(ii) 自己教師学習を活用して、学習済みの複数エキスパートをテスト時において適切に集約する、新たなテスト時エキスパート集約戦略。理論的に、本手法の自己教師付き戦略がテスト不特定クラス分布を確実に再現可能であることを示す。実験結果から、従来の長尾認識およびテスト不特定長尾認識の両方において、本手法の有効性が明確に示された。コードは以下のURLから公開されている:\url{https://github.com/Vanint/SADE-AgnosticLT}。