9日前
長尾認識のための再バランス化されたシアンシスコントラストマイニング
Zhisheng Zhong, Jiequan Cui, Zeming Li, Eric Lo, Jian Sun, Jiaya Jia

要約
深層ニューラルネットワークは、クラスが極端に不均衡なデータセットにおいて劣った性能を示す。対照学習の有望な成果を踏まえ、本研究では不均衡な認識問題に対処するため、リバランス・シメイセイ対照マイニング(ResCom)を提案する。数学的解析およびシミュレーション結果に基づき、教師あり対照学習は、元のバッチレベルおよびシメイセイバッチレベルの両方で二重のクラス不均衡問題に直面しており、これは長尾分類学習よりも深刻であると主張する。本論文では、元のバッチレベルにおいて、クラスバランスを考慮した教師あり対照損失を導入し、異なるクラスに適応的な重みを付与する。また、シメイセイバッチレベルでは、すべてのクラスに対して同一のキーデータ数を維持するクラスバランスキューを提案する。さらに、対照ロジットに関する不均衡な対照損失勾配は、正例と負例に分解可能であり、容易な正例および容易な負例は対照勾配を消失させる要因となることを指摘する。これに対し、情報量の高い正例・負例ペアを抽出する教師ありハードペアマイニングを提案し、対照計算の効率を高め、表現学習を改善する。最後に、2つの視点間の相互情報量を近似的に最大化するため、シメイセイバランスソフトマックスを提案し、対照損失と統合して一段階学習を実現する。広範な実験により、ResComが複数の長尾認識ベンチマークにおいて従来手法を大きく上回ることを示した。本研究のコードおよびモデルは、以下のURLにて公開されている:https://github.com/dvlab-research/ResCom。