HyperAIHyperAI

Command Palette

Search for a command to run...

部分ラベルを用いた画像マルチラベル分類におけるカテゴリ別微調整

Yapeng Wang Wei Ke Tenglong Wang Xu Yang Chak Fong Chong

概要

画像マルチラベル分類データセットは、通常、部分的にラベル付けされている(各サンプルについて、一部のカテゴリのラベルのみが知られている)。畳み込みニューラルネットワーク(CNN)を訓練するための代表的な手法として、「未知ラベルをすべて負ラベルとして扱う」Negativeモードが広く用いられている。しかし、この手法はカテゴリごとに不正確なラベルが不均等に発生するため、各カテゴリにおける二値分類性能が不同程度に低下するという問題を引き起こす。一方、未知ラベルの寄与を無視するIgnoreモードは、Negativeモードに比べて効果がやや低い可能性があるものの、訓練データに追加の誤ったラベルが含まれないという利点を有しており、これはNegativeモードが欠いている重要な特徴である。本論文では、Negativeモードで訓練されたモデルに対して適用可能な新しい後処理手法として、カテゴリごとのファインチューニング(Category-wise Fine-Tuning, CFT)を提案する。CFTは、分類層内のロジスティック回帰(LR)を、カテゴリごとに逐次的にIgnoreモードでファインチューニングすることで、各カテゴリの性能を独立して向上させる。Ignoreモードを用いることで、Negativeモードによる訓練段階での誤ラベルに起因する性能低下を低減することができる。特に、CFTでは遺伝的アルゴリズム(GA)とバイナリクロスエントロピーを用いてLRのファインチューニングを実施している。本手法の有効性は、CheXpertコンペティションデータセットを用いて評価された結果、現時点における最良の性能を達成した。公式評価サーバーに提出した単一モデルは、テストセットにおいてmAUC 91.82%を達成し、リーダーボードおよび既存の文献において最高の単一モデルスコアとなった。さらに、アンサンブルモデルでは、コンペティション終了後にテストセットが公開されたことを受けてローカルマシン上で評価した結果、mAUC 93.33%を達成し、リーダーボードおよび文献上の最高値(93.05%)を上回った。また、本手法の有効性は、部分的にラベル付けされたMS-COCOデータセットのバージョンに対しても検証されている。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています