2ヶ月前

パラメトリック分類による一般化されたカテゴリ発見:ベースライン研究

Xin Wen; Bingchen Zhao; Xiaojuan Qi
パラメトリック分類による一般化されたカテゴリ発見:ベースライン研究
要約

汎化カテゴリ発見(GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルの付いていないデータセットから新しいカテゴリを発見することを目指しています。これまでの研究では、パラメトリック分類器が既知のカテゴリに過学習しやすいという主張があり、半教師ありk-meansによって形成される非パラメトリック分類器の使用が推奨されていました。しかし、本研究ではパラメトリック分類器の失敗要因を調査し、高品質な教師情報が利用可能な場合における従来の設計選択肢の有効性を検証するとともに、信頼性の低い疑似ラベルが主要な問題であることを特定しました。これらの結果に基づき、2つの予測バイアスが存在することを示しました:分類器は既知のクラスをより頻繁に予測する傾向があり、既知と新規カテゴリ間で不均衡な分布を生成します。この問題に対処するために、エントロピー正則化を利用した単純かつ効果的なパラメトリック分類方法を提案します。本手法は複数のGCDベンチマークで最先端の性能を達成し、未知クラス数に対する強い堅牢性も示しています。本研究を通じて得られた調査結果と提案された単純なフレームワークが、今後のこの分野での研究を促進する強力なベースラインとなることを期待しています。コードは以下のURLで公開されています:https://github.com/CVMI-Lab/SimGCD。

パラメトリック分類による一般化されたカテゴリ発見:ベースライン研究 | 最新論文 | HyperAI超神経