9日前

潜在特徴と真値ラベル間の相互情報量最大化による長尾認識

Min-Kook Suh, Seung-Woo Seo
潜在特徴と真値ラベル間の相互情報量最大化による長尾認識
要約

対照学習(contrastive learning)手法は、多様な表現学習タスクにおいて優れた性能を示しているが、訓練データセットが長尾分布(long-tailed)である場合には困難に直面する。多くの研究者が対照学習とロジット調整(logit adjustment)技術を組み合わせてこの問題に対処しているが、これらの組み合わせは経験的・直感的なものであり、理論的根拠はまだ提供されていない。本論文の目的は、このような組み合わせに理論的背景を提供するとともに、性能をさらに向上させることにある。まず、対照学習手法が長尾タスクにおいて困難を抱える根本的な理由は、潜在特徴と入力データ間の相互情報量(mutual information)を最大化しようとする点にあることを示す。この最大化過程では真のラベル(ground-truth labels)が考慮されないため、クラスラベル間の不均衡に対処することができない。一方で、本研究では長尾認識タスクを、潜在特徴と真のラベルとの間の相互情報量最大化として捉える。このアプローチにより、対照学習とロジット調整を自然に統合し、長尾認識ベンチマークにおいて最先端の性能を達成する損失関数を導出する。さらに、この手法は画像セグメンテーションタスクにおいても有効性を示しており、画像分類を越えた汎用性を実証している。

潜在特徴と真値ラベル間の相互情報量最大化による長尾認識 | 最新論文 | HyperAI超神経