مُخطِّط طريق SPIN: استخراج الطرق من الصور الجوية عبر الاستدلال الرسومي المكاني والفضائي للتفاعل للقيادة الذاتية

استخراج الطرق هو خطوة أساسية في بناء أنظمة التنقل الذاتي. يُعد كشف أجزاء الطرق تحديًا كبيرًا نظرًا لتباين عرضها، وانقسامها في مختلف أجزاء الصورة، بالإضافة إلى احتمال تغطيتها بسبب التضاريس أو السحب أو الظروف الجوية الأخرى. إن استخدام شبكات التحويل العصبي (ConvNets) فقط لحل هذه المشكلة ليس فعّالًا، إذ تفتقر هذه الشبكات إلى الكفاءة في اكتشاف الاعتماديات البعيدة بين أجزاء الطرق في الصورة، وهي مهارة حيوية لاستخلاص الاتصال بين أجزاء الطرق. ولحل هذه المشكلة، نقترح وحدة استدلال رياضيّة تُسمى "SPIN" (استدلال فضائي وفضاء تفاعلي)، والتي يمكن دمجها في شبكة تحوّل عصبي (ConvNet) لتنفيذ عملية استدلال على رسم بيانيّ مبني على الفضاءات المكانية وفضاء التفاعل، والتي تُستخلص من خرائط الميزات. إذ يُسهم الاستدلال على الفضاء المكاني في استخلاص الاعتماديات بين مناطق مكانية مختلفة والمعلومات السياقية الأخرى، بينما يساعد الاستدلال على الفضاء التفاعلي المُشَكَّل في التمييز الدقيق للطرق عن التضاريس الأخرى المُتّصلة بالصورة. وبهذا، تُستخرج وحدة SPIN الاعتماديات على مسافات طويلة بين أجزاء الطرق، وتميّز الطرق بدقة عن الفئات الأخرى في الصورة. كما نقدّم هرمًا يعتمد على SPIN، يقوم بتنفيذ استدلال الرسم البياني SPIN عبر مقاييس متعددة لاستخراج ميزات متعددة المقاييس. ونُقدّم شبكة قائمة على وحدات "الساعة المُتكررة" (stacked hourglass) وهرم SPIN، والتي تحقق أداءً أفضل مقارنةً بالأساليب الحالية. علاوةً على ذلك، فإن طريقة عملنا فعّالة من حيث الحوسبة، وتحسّن بشكل كبير من سرعة التقارب أثناء التدريب، مما يجعلها قابلة للتطبيق على صور جوية عالية الدقة وذات مساحة كبيرة. يمكن الوصول إلى الكود من خلال: https://github.com/wgcban/SPIN_RoadMapper.git.