توقع الحوادث المرورية المستند إلى عدم اليقين باستخدام التعلم العلائقي المكاني-الزماني

تنبؤ الحوادث المرورية يهدف إلى التنبؤ بالحوادث من مقاطع الفيديو المسجلة بواسطة كاميرات القيادة (dashcam) في أقرب وقت ممكن، وهو أمر حيوي لضمان سلامة أنظمة القيادة الذاتية. مع المشاهد المرورية المعقدة والدلائل البصرية المحدودة، يعد التنبؤ بوقت حدوث الحادث من الإطارات الأولى التي يتم رصدها تحديًا كبيرًا. معظم النهج الحالية تركز على تعلم خصائص الوكلاء ذوي الصلة بالحادث للتنبؤ بالحوادث، بينما تتجاهل خصائص علاقاتهم المكانية والزمنية. بالإضافة إلى ذلك، يمكن أن تكون الشبكات العصبية العميقة الحالية القائمة على التحديد مفرطة الثقة في التوقعات الخاطئة، مما يؤدي إلى زيادة خطر وقوع حوادث مرورية بسبب أنظمة القيادة الذاتية. في هذا البحث، نقترح نموذج تنبؤ بالحوادث يستند إلى عدم اليقين مع تعلم العلاقات المكانية والزمنية. يقوم هذا النموذج بتوقع احتمالية وقوع الحوادث المرورية بشكل متتابع باستخدام مقاطع الفيديو المسجلة بواسطة كاميرات القيادة (dashcam). وبشكل خاص، نقترح الاستفادة من التحليل المتعدد الرتب (graph convolution) والشبكات الدورية (recurrent networks) لتعلم الخصائص العلاقية، واستخدام الشبكات العصبية البيزانية (Bayesian neural networks) للتعامل مع التباين الداخلي للتمثيلات العلاقية الكامنة. تم العثور على دالة الخسارة المستندة إلى عدم اليقين المقترحة لتحسين أداء النموذج بشكل كبير من خلال تحسين جودة الخصائص العلاقية. بالإضافة إلى ذلك، قمنا بجمع مجموعة بيانات جديدة لحوادث السيارات (Car Crash Dataset - CCD) للتنبؤ بالحوادث المرورية تحتوي على سمات بيئية وأسباب الحوادث. أظهرت نتائج التجارب على كل من البيانات العامة والمجموعة الجديدة التي تم جمعها الأداء الرائد لنموذجنا. يتوفر شفرتنا ومجموعة بيانات CCD على الرابط: https://github.com/Cogito2012/UString.