10日前

長尾認識における最適輸送:学習可能なコスト行列を用いた手法

{Ping Li, Mingming Sun, Hanyu Peng}
長尾認識における最適輸送:学習可能なコスト行列を用いた手法
要約

長尾認識問題(long-tailed recognition problem)は、近年非常に注目を集めている重要な課題である。従来の認識問題とは異なり、本問題では学習データセットの割り当てが極めて歪んでおり、検証およびテストデータセットはバランスが取れているという前提が設けられている。当然のことながら、学習データとテストデータ間の分布シフトにより、モデルの一般化性能に深刻な課題が生じる。この課題に対処するアプローチは、主に二つの方向に分かれる。第一に、学習段階でモデルの潜在能力を活用し、一般化性能を向上させる「学習に配慮した手法」であり、第二に、学習に配慮した手法と組み合わせて用いられる「事後補正(post-hoc correction)」である。後者は予測結果を後処理段階で可能な限り改善することを目的としており、実装の簡便さと高い有効性という利点を持つ。本論文では、従来の統計的手法を越える新たな事後補正のアプローチを提案する。数学的には、最適輸送(optimal transport, OT)の視点から問題にアプローチするが、OTを適用する際の正確なコスト行列の選定は困難であり、各タスクに対する専門知識が不可欠である。この制約を克服するため、我々は線形写像を用いてコスト行列を適応的に学習する手法を提案する。実践的な検証を通じて行った実験の結果、本手法は高い効率性と優れた性能を実現し、これまでのすべての手法を上回り、現時点で最も優れた性能を達成した。

長尾認識における最適輸送:学習可能なコスト行列を用いた手法 | 最新論文 | HyperAI超神経