2ヶ月前
CleanNet: ラベルノイズを含む大規模な画像分類器のトレーニングにおける転移学習
Kuang-Huei Lee; Xiaodong He; Lei Zhang; Linjun Yang

要約
本論文では、ラベルノイズを伴う画像分類モデルの学習問題について研究しています。既存の手法は、人間の監視に依存するため一般的にはスケーラビリティが低く、手動で正しいまたは誤ったラベルを特定することは時間のかかる作業です。一方で、人間の監視に依存しない手法はスケーラブルですが、効果が低いという課題があります。ラベルノイズのクリーニングに必要な人間の監視量を減らすために、CleanNet(クリーンネット)と呼ばれる共同ニューラル埋め込みネットワークを導入します。このネットワークは、クラス全体の一部のみを手動で検証することで、他のクラスにも転送可能なラベルノイズに関する知識を提供します。さらに、CleanNetと従来の畳み込みニューラルネットワーク分類器を統合し、画像分類学習の一連のフレームワークとして提案します。提案されたアルゴリズムの有効性については、複数の大規模データセット上でラベルノイズ検出タスクおよびノイジーなデータでの画像分類タスクにおいて示しています。実験結果によると、CleanNetは現行の弱い教師あり手法と比較して、人間による監視が利用できないホールドアウトクラスにおけるラベルノイズ検出エラー率を41.5%削減しました。また、画像分類タスクにおいて全画像を検証する場合と比較して3.2%の画像のみを検証することで47%の性能向上を達成しています。ソースコードとデータセットは kuanghuei.github.io/CleanNetProject から入手可能です。