مجموعة بيانات القيادة الذاتية DrivingDojo
التاريخ
الحجم
رابط النشر
تم إنشاء مجموعة بيانات DrivingDojo بشكل مشترك من قبل مختبر التعرف على الأنماط الجديد التابع لمعهد الأتمتة، والأكاديمية الصينية للعلوم، وكلية الذكاء الاصطناعي التابعة لجامعة الأكاديمية الصينية للعلوم، ميتوان، ومركز هونج كونج للذكاء الاصطناعي والروبوتات التابع للأكاديمية الصينية للعلوم في عام 2024.مجموعة بيانات DrivingDojo: تطوير نموذج عالم القيادة التفاعلي والغني بالمعرفة"، الذي يهدف إلى تطوير نماذج تفاعلية وغنية بالمعرفة لعالم القيادة. تحتوي هذه المجموعة من البيانات على حوالي 18 ألف مقطع فيديو، وهي مصممة خصيصًا لمحاكاة التفاعلات البصرية في العالم الواقعي، وتغطي حركات القيادة الغنية، والتفاعلات متعددة الأطراف، ومعرفة القيادة في العالم المفتوح.
تتميز مجموعة بيانات DrivingDojo باكتمال الإجراءات والتفاعلات بين الوكلاء المتعددين والمعرفة الغنية بالقيادة في العالم المفتوح. ولا يشمل ذلك العمليات الطولية مثل التسارع والفرملة الطارئة والتوقف والتشغيل فحسب، بل يشمل أيضًا العمليات الجانبية مثل الدوران والتجاوز وتغيير المسارات. بالإضافة إلى ذلك، تم تصميم مجموعة البيانات خصيصًا لتحتوي على عدد كبير من مقاطع الفيديو لمسارات التفاعل بين الوكلاء المتعددين، مثل الإدخالات والقطع والاندماجات الأمامية. يتضمن DrivingDojo أيضًا مقاطع فيديو لأحداث نادرة، مثل عبور الحيوانات، والزجاجات المتساقطة، وحطام الطريق، والتي من المحتمل مواجهتها في سيناريوهات القيادة في العالم الحقيقي.
دقة الفيديو لمجموعة البيانات هي 1920×1080 ومعدل الإطارات هو 5 إطارات في الثانية. تم التقاط مقاطع الفيديو من المدن الكبرى في الصين، بما في ذلك بكين، وشنتشن، وشوتشو، وغيرها، وتم تسجيلها في ظل ظروف جوية مختلفة وظروف ضوء النهار. يتم إقران جميع مقاطع الفيديو مع أوضاع الكاميرا المتزامنة المستمدة من مجموعة تحديد المواقع عالية الدقة التي يتم تشغيلها بواسطة HD-Map الموجود على متن الطائرة. يتم أيضًا إقران مقاطع الفيديو الموجودة في المجموعة الفرعية DrivingDojo-Open بأوصاف نصية حول الأحداث النادرة التي حدثت في كل مقطع فيديو.
لقياس التقدم في نمذجة سيناريو القيادة، تقترح مجموعة بيانات DrivingDojo أيضًا معيارًا جديدًا لمتابعة تعليمات العمل (AIF) لتقييم قدرة النموذج العالمي على إجراء تنبؤات مستقبلية معقولة. يقوم هذا المعيار بتقييم إمكانية التحكم في الحركة على المدى الطويل عن طريق حساب الخطأ بين الإجراءات في مقاطع الفيديو المولدة والأوامر المقدمة.
بشكل عام، توفر مجموعة بيانات DrivingDojo موردًا قيمًا لمجتمع القيادة الذاتية، بهدف تحسين قدرات التنبؤ والتحكم في النماذج العالمية في بيئات القيادة المعقدة.
