2ヶ月前

非対称な分布に対する認識における表現と分類器の解耦

Bingyi Kang; Saining Xie; Marcus Rohrbach; Zhicheng Yan; Albert Gordo; Jiashi Feng; Yannis Kalantidis
非対称な分布に対する認識における表現と分類器の解耦
要約

視覚世界のロングテール分布は、ディープラーニングに基づく分類モデルがクラス不均衡問題をどのように処理するかに大きな課題をもたらしています。既存の解決策は通常、損失の再重み付け、データの再サンプリング、またはヘッドクラスからテールクラスへの転移学習などのクラスバランス戦略を含んでいますが、これらの大半は表現と分類器を同時学習するスキームに従っています。本研究では、学習プロセスを表現学習と分類に分離し、異なるバランス戦略がロングテール認識にどのように影響を与えるかを系統的に検討しました。その結果は驚くべきものでした:(1) 高品質な表現を学習する上でデータの不均衡が問題ではない可能性があります;(2) 最も単純なインスタンスバランス(自然)サンプリングで学習した表現を使用して、分類器のみを調整することで強力なロングテール認識能力を得ることも可能です。私たちは広範な実験を行い、ImageNet-LT, Places-LT, iNaturalist などの一般的なロングテールベンチマークにおいて新しい最先端の性能を達成しました。これらの結果は、表現と分類を分離した単純なアプローチを使用することで、慎重に設計された損失関数やサンプリング戦略だけでなく、メモリを持つ複雑なモジュールさえも上回ることが可能であることを示しています。私たちのコードは https://github.com/facebookresearch/classifier-balancing で利用可能です。翻译说明:内容准确:确保了专业术语如“long-tail distribution”(ロングテール分布)、“deep learning”(ディープラーニング)、“class imbalance problem”(クラス不均衡問題)、“representation learning”(表現学習)、“classifier”(分類器)等的正确翻译。表达流畅:采用了符合日语表达习惯的句式和词汇,避免了生硬直译。表述正式:使用了正式且客观的科技或学术写作风格,避免了口语化表达。忠于原文:在保持原意的基础上优化了句子结构,使其更符合日语读者的阅读习惯。