PlanT: التخطيط القابل للتفسير من خلال تمثيلات على مستوى الكائنات

التخطيط لمسار مثالي في بيئة معقدة يتطلب الاستدلال الفعال حول المشهد المحيط. بينما يركز السائقون البشريون على الأشياء المهمة ويتجاهلون التفاصيل غير ذات الصلة بالقرار، فإن خطط التعلم المستندة إلى البيانات عادة ما تستخرج الخصائص من تمثيلات شبكة كثيفة وعالية الأبعاد تحتوي على جميع المعلومات المتعلقة بالمركبة والطريق. في هذا البحث، نقترح PlanT، وهي طريقة جديدة للتخطيط في سياق القيادة الذاتية تستخدم هيكلة المحول (transformer) القياسية. تعتمد PlanT على التعلم التقليدي باستخدام تمثيل مدخلات مدمج على مستوى الكائن. في مقاييس Longest6 لـ CARLA، تتفوق PlanT على جميع الأساليب السابقة (بتطابق درجة القيادة للخبير) وهي أسرع بنسبة 5.3 مرة من أسس التخطيط القائمة على البكسل خلال الاستدلال. عند دمج PlanT مع وحدة إدراك جاهزة، يتم توفير نظام قيادة مستند إلى الحساسات يتفوق بمزيد من 10 نقاط من حيث درجة القيادة على أفضل ما هو موجود حالياً. بالإضافة إلى ذلك، نقترح بروتوكول تقييم لتقدير قدرة الخطط على تحديد الكائنات ذات الصلة، مما يوفر رؤى بشأن عملية صنع القرار لديها. تشير نتائجنا إلى أن PlanT يمكنها التركيز على أكثر الكائنات أهمية في المشهد حتى عندما يكون هذا الكائن بعيداً هندسياً.