10日前

長尾データセットにおけるマルチラベル分類のための分布バランス損失

Tong Wu, Qingqiu Huang, Ziwei Liu, Yu Wang, Dahua Lin
長尾データセットにおけるマルチラベル分類のための分布バランス損失
要約

多クラスラベル認識問題において、クラス分布が長尾型を示す場合に適した新しい損失関数「Distribution-Balanced Loss」を提案する。従来の単ラベル分類問題と比較して、多ラベル認識問題は、ラベルの共起(co-occurrence)および負ラベルの優位性(複数の二値分類問題として扱った場合に顕著)という二つの重要な課題により、より困難であることが一般的である。本研究で提案するDistribution-Balanced Lossは、標準的な二値交差エントロピー損失に対して以下の2つの鍵となる改良を施すことで、これらの課題に対処する。1)ラベルの共起による影響を考慮した新たな重み再平衡手法、および2)負ラベルの過剰な抑制を緩和するための負ラベル耐性正則化(negative tolerant regularization)である。Pascal VOCおよびCOCOの両データセットにおける実験結果から、本損失関数を用いて学習されたモデルが、従来の手法に比べて顕著な性能向上を達成することが示された。コードおよびモデルは以下のURLで公開されている:https://github.com/wutong16/DistributionBalancedLoss