2ヶ月前

CurriculumNet: 大規模ウェブ画像からの弱教師あり学習

Sheng Guo; Weilin Huang; Haozhi Zhang; Chenfan Zhuang; Dengke Dong; Matthew R. Scott; Dinglong Huang
CurriculumNet: 大規模ウェブ画像からの弱教師あり学習
要約

私たちは、テキストクエリを使用してインターネットから直接クロールされた大量の弱教師ありウェブ画像を対象に、人間のアノテーションなしで深層ニューラルネットワークを訓練するための単純かつ効率的な手法を提案します。本研究では、カリキュラム学習を活用した原理に基づいた学習戦略を開発し、大量のノイジーなラベルとデータの不均衡を効果的に処理することを目指しています。特徴空間におけるデータ分布密度を用いてデータの複雑さを測定し、非監督的な方法でその複雑さをランク付けすることで新しい学習カリキュラムを設計しました。これにより、大規模なウェブ画像に対するカリキュラム学習の効率的な実装が可能となり、ノイジーなラベルによる悪影響が大幅に軽減された高性能なCNNモデルが得られます。重要な点は、実験によって高ノイズラベルを持つ画像が正則化の一形態として機能し、モデルの汎化能力を驚くほど向上させることを示していることです。私たちの手法はWebVision、ImageNet、Clothing-1MおよびFood-101という4つのベンチマークで最先端の性能を達成しました。複数モデルのアンサンブルを使用することで、1000クラス分類におけるWebVisionチャレンジでトップ5誤認識率5.2%という結果を得ました。この結果は他の追随を許さず、2位との相対誤認識率がほぼ50%も優れていました。コードとモデルは以下のURLから入手可能です: https://github.com/MalongTech/CurriculumNet 。

CurriculumNet: 大規模ウェブ画像からの弱教師あり学習 | 最新論文 | HyperAI超神経