TwinLiteNetPlus: نموذج تجزئة متعدد المهام في الزمن الفعلي للقيادة الذاتية

تُعد التجزئة الدلالية أمرًا بالغ الأهمية للقيادة الذاتية، خاصةً في مهام تحديد المناطق القابلة للقيادة وتحديد المسارات، حيث تضمن السلامة والتنقل الفعّال. وللتغلب على التكاليف الحسابية العالية الناتجة عن النماذج الحالية الأفضل أداءً (SOTA)، يقدّم هذا البحث نموذج TwinLiteNetPlus، الذي يتمتع بقدرة على تحقيق توازن فعّال بين الكفاءة والدقة. يدمج TwinLiteNetPlus التحويلات المُتعددة المُضاعفة القياسية والتحويلات المُتعددة المُضاعفة المنفصلة في الاتجاه العمودي (depth-wise separable dilated convolutions)، مما يقلل من التعقيد مع الحفاظ على دقة عالية. ويتوفر النموذج في أربع تكوينات، تتراوح من النموذج القوي الذي يحتوي على 1.94 مليون معلمة (TwinLiteNetPlus_{Large}) إلى النموذج الخفيف جدًا الذي يحتوي على 34 ألف معلمة (TwinLiteNetPlus_{Nano}). وتميّز نموذج TwinLiteNetPlus_{Large} بتحقيقه 92.9% من متوسط تقاطع الوحدات (mIoU) في تجزئة المناطق القابلة للقيادة، و34.2% من تقاطع الوحدات (IoU) في تجزئة المسارات. وتحقيق هذه النتائج أداءً متميزًا، حيث تفوق النماذج الحالية الأفضل أداءً، مع احتياجها فقط إلى 11 مرة أقل من العمليات الحسابية النقطية العائمة (FLOPs). وقد أُجريت تقييمات صارمة على أجهزة مدمجة متنوعة، وقد أظهر TwinLiteNetPlus أداءً واعدًا من حيث التأخير (latency) وكفاءة الطاقة، مما يؤكد إمكاناته الكبيرة في التطبيقات الواقعية للمركبات ذاتية القيادة. يُمكن الوصول إلى الكود عبر الرابط: https://github.com/chequanghuy/TwinLiteNetPlus.