4ヶ月前

ノイジーなデータの不合理な効果:細かい認識への応用

Jonathan Krause; Benjamin Sapp; Andrew Howard; Howard Zhou; Alexander Toshev; Tom Duerig; James Philbin; Li Fei-Fei
ノイジーなデータの不合理な効果:細かい認識への応用
要約

現在の細部認識の手法は以下の手順を踏む:まず、専門家を募って画像データセットに注釈をつけ、必要に応じて部位注釈やバウンディングボックスなどのより構造化されたデータも収集する。次に、このデータを利用してモデルを訓練する。細部認識の解決を目指して、私たちはウェブから得られる無料でノイジーなデータと単純かつ汎用的な認識方法を活用した代替アプローチを提案します。このアプローチは性能とスケーラビリティの両面で利点があります。私たちは4つの細部認識データセットにおいてその効果を示し、単一のラベルさえ手動で収集せずに既存の最先端技術を大幅に上回りました。さらに、10,000以上の細部カテゴリへのスケーリングに関する最初の結果も示しています。定量的に、CUB-200-2011では92.3%、Birdsnapでは85.4%、FGVC-Aircraftでは93.4%、Stanford Dogsでは80.8%というトップ-1精度を達成しました(これらのデータセットのアノテーション付きトレーニングセットを使用せずに)。私たちはこのアプローチを細部認識データセットの拡大のために使用されるアクティブラーニングアプローチと比較しました。