BDD100K: مجموعة متنوعة للقيادة لتعلم متعدد المهام غير المتجانس

تشكل قواعد البيانات الدافع الرئيسي لتطور الرؤية في مجال تقنيات القيادة، ومع ذلك فإن قواعد بيانات القيادة الحالية تعاني من نقص في المحتوى البصري والمهمات المدعومة لدراسة التعلم متعدد المهام للقيادة الذاتية. عادة ما يكون الباحثون مقيدين بدراسة مجموعة صغيرة من المشكلات على قاعدة بيانات واحدة، بينما تتطلب التطبيقات البصرية الحقيقية للحواسيب تنفيذ مهمات ذات تعقيدات متنوعة. لقد أنشأنا BDD100K، وهي أكبر قاعدة بيانات فيديو للقيادة تحتوي على 100 ألف فيديو و10 مهمات لتقييم التقدم الملحوظ في خوارزميات التعرف على الصور في مجال القيادة الذاتية. تتميز هذه القاعدة بالتنوع الجغرافي والبيئي والجوي، مما يجعلها مفيدة لتدريب النماذج التي من الأقل احتمال أن تتفاجأ بالظروف الجديدة. بناءً على هذا التنوع الكبير، قمنا بإنشاء معيار لتعلم المهام المتعددة غير المتجانسة ودرسنا كيفية حل هذه المهام معًا. تظهر تجاربنا أنه يجب استخدام استراتيجيات تدريب خاصة لنماذج موجودة لأداء مثل هذه المهام غير المتجانسة. يفتح BDD100K الباب أمام دراسات مستقبلية مهمة في هذا المجال.