
要約
本論文では、大規模な畳み込みニューラルネットワークを用いた半教師付き学習の研究について述べます。我々は、教師/学生のパラダイムに基づくパイプラインを提案し、最大10億枚の未ラベル画像の収集を活用します。主な目標は、ResNet-50やResNextなどの特定のターゲットアーキテクチャの性能を向上させることです。我々は、このアプローチの成功要因を詳細に分析し、半教師付き学習による画像分類で高精度モデルを作成するためのいくつかの推奨事項を提示します。その結果、我々のアプローチは標準的な画像、動画、および細かい分類アーキテクチャに対して重要な改善をもたらしました。例えば、10億枚の未ラベル画像を利用することで、我々が学習したシンプルなResNet-50はImageNetベンチマークで81.2%のトップ-1精度を達成しています。