2ヶ月前
iNaturalist 種分類および検出データセット
Grant Van Horn; Oisin Mac Aodha; Yang Song; Yin Cui; Chen Sun; Alex Shepard; Hartwig Adam; Pietro Perona; Serge Belongie

要約
既存のコンピュータビジョンで使用される画像分類データセットは、物体カテゴリ間で画像の分布が均一である傾向があります。一方、自然界では一部の種が他の種よりも多く存在し、撮影しやすいことから、極めて不均衡な分布となっています。現実世界の困難な条件でのさらなる進歩を促すため、私たちはiNaturalist種分類および検出データセットを提示します。このデータセットには、5,000種以上の植物や動物の859,000枚の画像が含まれています。視覚的に類似した種が、世界各地で多様な状況下で撮影されており、異なるカメラタイプを使用して収集され、画像品質も様々です。また、大規模なクラス不均衡があり、複数の市民科学者によって検証されています。本稿では、データセットの収集方法について説明し、最先端のコンピュータビジョン分類および検出モデルを使用した広範なベースライン実験を報告します。結果は、現在のアンサンブル非依存手法がトップ1分類精度で67%しか達成していないことを示しており、データセットの難易度を浮き彫りにしています。特に、学習例が少ないクラスでの結果が悪く、低ショット学習(low-shot learning)に対するより多くの注意が必要であることが明らかになりました。