9日前

不均衡データセット向けの事後再補正

Junjiao Tian, Yen-Cheng Liu, Nathan Glaser, Yen-Chang Hsu, Zsolt Kira
不均衡データセット向けの事後再補正
要約

ニューラルネットワークは、学習ラベルの分布が著しく不均衡である場合、およびテストデータが学習データの分布と異なる場合に性能が低下しやすい。特に、ラベル分布の不均衡が引き起こすテストラベル分布のシフトに対処するため、最適なベイズ分類器の観点から問題を定式化し、KLダイバージェンスに基づく最適化によって解ける、訓練後の事前分布の再調整手法を提案する。この手法により、検証データセット上で効率的に調整可能な柔軟な訓練後ハイパーパラメータを導入し、分類器のマージンを適切に修正することで、ラベル不均衡に対応可能となる。さらに、既存の尤度シフト対処法を同様のベイズ的視点から再解釈し、本手法と組み合わせることで、両方の問題を統一的に扱うことが可能であることを示した。得られたアルゴリズムは、下位のネットワークアーキテクチャに依存しない確率的分類問題に容易に適用可能である。6つの異なるデータセットおよび5種類の異なるアーキテクチャにおける実験結果から、iNaturalist(分類タスクにおける大規模不均衡データセット)やSynthia(セマンティックセグメンテーションタスク)を含む複数の設定において、最先端の精度を達成した。実装コードは以下のGitHubリポジトリにて公開されている:https://github.com/GT-RIPL/UNO-IC.git

不均衡データセット向けの事後再補正 | 最新論文 | HyperAI超神経