
要約
畳み込みニューラルネットワーク(CNNs)は、多数の認識および学習タスクに成功裏に適用されてきました。その一般的なレシピは、非常に大きな教師ありサンプルデータセット上で深層モデルを訓練することです。しかし、実際にはこのアプローチは制約が多いため、大量のラベル付き画像を集めるのは非常にコストがかかります。この問題を緩和する一つの方法は、大規模なコレクションからラベル付けすべき画像を選択する賢い手法を考え出すことです(つまり、能動学習)。我々の経験的研究では、文献に記載されている多くの能動学習のヒューリスティックがバッチ設定でCNNsに適用された場合、効果的ではないことが示唆されています。これらの制限に着想を得て、能動学習の問題をコアセット選択として定義しました。つまり、選択されたサブセット上で学習したモデルが残りのデータポイントに対して競争力を持つようなポイントの集合を選ぶことを指します。さらに、データポイントの幾何学的特性を使用して任意の選択されたサブセットの性能を特徴付ける理論的な結果を提示しています。能動学習アルゴリズムとして、我々の特徴づけによると最良の結果が期待されるサブセットを選択しました。実験結果は、提案手法が画像分類実験において既存のアプローチを大幅に上回ることを示しています。以上のように翻訳することで、内容の正確さと表現の流暢さを保ちつつ、正式かつ客観的な科技ニュースや学術論文に適したスタイルで提供しています。