3ヶ月前

信頼性のある長尾分類

Bolian Li, Zongbo Han, Haining Li, Huazhu Fu, Changqing Zhang
信頼性のある長尾分類
要約

長尾分布データ上の分類は、深刻なクラス不均衡に悩まされ、特に末尾クラス(tail classes)においては性能が期待に応えないという困難な問題である。近年、アンサンブルに基づく手法が最先端の性能を達成し、大きな潜在能力を示している。しかし、現在の手法には二つの限界がある。第一に、失敗に敏感な応用において予測の信頼性が乏しく、特に誤分類が頻発する末尾クラスにおいて深刻な問題となる。第二に、すべてのサンプルに同一の数のエキスパート(専門家)を割り当てており、容易なサンプルに対しては計算コストが過剰にかかり、冗長性が生じる。これらの問題に対処するため、本研究では信頼性の高い長尾分類(Trustworthy Long-tailed Classification: TLC)手法を提案する。このTLCは、マルチエキスパートフレームワーク上で分類と不確実性推定を統合的に実行し、困難なサンプルを特定することを目的とする。TLCは各エキスパートに対して証拠(evidence)と証拠に基づく不確実性(Evidence-based Uncertainty: EvU)を取得し、その後、デムステル・シャファー証拠理論(Dempster-Shafer Evidence Theory: DST)を用いてこれらの不確実性と証拠を統合する。さらに、容易なサンプルに対して関与するエキスパート数を動的に制御する「動的エキスパート参加(dynamic expert engagement)」を提案することで、計算効率を向上させつつ、優れた性能を維持する。最後に、分類、末尾クラス検出、OOD(Out-of-Distribution)検出、および失敗予測という複数のタスクにおいて包括的な実験を実施した。実験結果から、提案手法TLCは既存手法を上回る性能を発揮し、信頼性の高い不確実性推定を可能にすることから、信頼性のある分類システムとしての実用性を示した。