2ヶ月前
データ効率的な画像認識におけるコントラスティブ予測符号化
Olivier J. Hénaff; Aravind Srinivas; Jeffrey De Fauw; Ali Razavi; Carl Doersch; S. M. Ali Eslami; Aaron van den Oord

要約
人間の観察者は、わずかな例から新しい画像のカテゴリーを認識する能力を持っていますが、人工的なものでこれを実現することは未だに解決されていない課題です。私たちは、データ効率的な認識は、自然信号の変動性をより予測可能にする表現によって可能になると仮説を立てています。したがって、このような表現を学習するための非監督学習目標であるContrastive Predictive Coding(対照的予測符号化)を見直し、改善しました。この新しい実装により、ImageNetデータセットでの最先端の線形分類精度を支える特徴量が生成されます。深層ニューラルネットワークを使用した非線形分類の入力として利用される場合、この表現は直接画像ピクセル上で訓練された分類器よりも2〜5倍少ないラベルを使用することができます。最後に、この非監督表現はPASCAL VOCデータセットでの物体検出への転移学習を大幅に向上させ、完全に監督されたImageNet分類器の事前学習を上回ります。