10日前

長尾多ラベル画像分類における確率誘導型損失

{Dekun Lin}
要約

近年、ロングテール学習はますます注目を集めている。その中でも、ロングテール多ラベル画像分類は一つの重要なサブタスクでありながら、依然として困難な課題であり、十分に研究されていない。本論文では、確率の観点からこの問題に新たな視点を提供する。具体的には、従来のロングテール多ラベル分類におけるコストセンシティブ学習手法が、学習過程において正ラベルと負ラベルの予測確率に不同程度の影響を及ぼすことを発見した。さらに、確率の推移の違いが最終的な性能に直接影響することを明らかにした。このため、このプロセスを制御するための確率誘導型損失関数を提案する。本損失関数は2つの構成要素からなる。一つは確率再平衡(probability re-balancing)であり、学習中の確率プロセスを柔軟に調整可能である。もう一つは適応的確率認識型ファーカル損失(adaptive probability-aware focal)であり、正ラベルと負ラベル間の確率ギャップをさらに縮小する。本手法は、2つのロングテール多ラベル画像分類データセット(VOC-LT および COCO-LT)上で広範な実験を実施し、提案戦略の妥当性および優位性を実証した。