مجموعة بيانات تصنيف ورصد الأنواع في iNaturalist

القواعد البيانات الحالية المستخدمة في تصنيف الصور في مجال الرؤية الحاسوبية تميل إلى أن تكون موزعة بشكل متجانس عبر فئات الأشياء. بخلاف ذلك، العالم الطبيعي يعاني من عدم التوازن الشديد، حيث تكون بعض الأنواع أكثر وفرة وسهولة في التصوير من غيرها. لتشجيع المزيد من التقدم في ظروف العالم الحقيقي الصعبة، نقدم قاعدة بيانات تصنيف ورصد الأنواع من iNaturalist، والتي تتكون من 859,000 صورة لأكثر من 5,000 نوع مختلف من النباتات والحيوانات. تحتوي هذه القاعدة على أنواع مرئياً مشابهة تم التقاطها في مجموعة متنوعة من الظروف حول العالم. تم جمع الصور باستخدام أنواع مختلفة من الكاميرات، وتتميز بجودة صورية متغيرة، وعدم توازن كبير بين الفئات، وقد تم التحقق منها بواسطة العديد من العلماء المواطنين. نناقش عملية جمع القاعدة البيانات ونقدم تجارب أساسية واسعة النطاق باستخدام نماذج تصنيف ورصد الرؤية الحاسوبية المعاصرة. تظهر النتائج أن الطرق الحالية التي لا تعتمد على الجمع (non-ensemble) تحقق دقة تصنيف بنسبة 67% فقط للتصنيف الأول، مما يوضح صعوبة القاعدة البيانات. بشكل خاص، نلاحظ نتائج ضعيفة للفئات ذات عدد قليل من أمثلة التدريب، مما يشير إلى الحاجة لمزيد من الاهتمام بالتعلم قليل الإجراء (low-shot learning).