HyperAIHyperAI
منذ 11 أيام

MFNet: نحو التجزئة الدلالية في الوقت الفعلي للمركبات ذاتية القيادة مع المشاهد متعددة الطيف

{Tatsuya Harada, Yoshitaka Ushiku, Takumi Karasawa, Kohei Watanabe, Qishen Ha}
الملخص

يُعالج هذا العمل تصنيف المعاني للصور المأخوذة من مشاهد الطرق لسيارات ذاتية القيادة، وذلك بناءً على مجموعة بيانات جديدة من نوع RGB-Thermal، والتي تم تقديمها أيضًا في هذه الورقة. وقد أدى الاهتمام المتزايد بالسيارات ذاتية القيادة إلى تكييف تقنيات التصنيف المعنوي لتناسب الأنظمة ذاتية القيادة. ومع ذلك، فإن الأبحاث الحديثة المتعلقة بالتصنيف المعنوي تركز بشكل رئيسي على الصور الملونة (RGB) المُستخرجة في أوقات الرؤية المنخفضة، مثل الليل أو في ظروف جوية سيئة. علاوةً على ذلك، ركّزت معظم هذه الأساليب على تحسين الأداء مع إهمال استهلاك الوقت. وقد دفعنا هذا التحدي إلى اقتراح معمارية جديدة لشبكة عصبية تلافيفية (CNN) للتصنيف المعنوي للصور متعددة الطيف، تتيح الحفاظ على دقة التصنيف أثناء التشغيل في الوقت الفعلي. وقد قمنا بتمييز أداء طريقة العمل ببناء مجموعة بيانات RGB-Thermal، حيث تم دمج الصور الحرارية مع الصور الملونة. وأظهرنا أن دقة التصنيف تزداد بشكل ملحوظ عند إضافة معلومات الأشعة تحت الحمراء الحرارية.

MFNet: نحو التجزئة الدلالية في الوقت الفعلي للمركبات ذاتية القيادة مع المشاهد متعددة الطيف | أحدث الأوراق البحثية | HyperAI