HyperAIHyperAI
منذ 2 أشهر

تبحث مرة واحدة فقط للتعامل في الوقت الحقيقي والمهام المتعددة العامة

Wang, Jiayuan ; Wu, Q. M. Jonathan ; Zhang, Ning
تبحث مرة واحدة فقط للتعامل في الوقت الحقيقي والمهام المتعددة العامة
الملخص

الدقة العالية، الوزن الخفيف، والاستجابة الفورية هي ثلاثة متطلبات أساسية لتنفيذ القيادة الذاتية. في هذه الدراسة، ندمج نموذج A-YOLOM المتعدد المهام والمصمم للتكيف والعمل الفوري والوزن الخفيف، والذي يهدف إلى معالجة مهام الكشف عن الأشياء، وتقسيم المناطق القابلة للقيادة، وتقسيم خطوط المسار بشكل متزامن. بوجه خاص، نطور نموذجًا متعدد المهام من النهاية إلى النهاية مع بنية تقسيم موحدة ومبسّطة. نقدم معلمة قابلة للتعلم تربط بين الخصائص في الرقبة والهيكل الأساسي بشكل تكيفي في مهام التقسيم، باستخدام نفس دالة الخسارة لجميع مهام التقسيم. هذا يلغي الحاجة إلى التعديلات الخاصة ويحسن قدرات التعميم للنموذج. كما نقدم رأس تقسيم يتكون فقط من سلسلة من طبقات التحويل الإقليمي (Convolutional Layers)، مما يقلل عدد المعلمات ووقت الاستدلال. حققنا نتائج تنافسية على مجموعة بيانات BDD100k، خاصة فيما يتعلق بنتائج التصور البصري. تظهر نتائج الأداء معدل دقة 50 (mAP50) بنسبة 81.1% للكشف عن الأشياء، ومتوسط تقاطع على الاتحاد (mIoU) بنسبة 91.0% لتقسيم المناطق القابلة للقيادة، وتقاطع على الاتحاد (IoU) بنسبة 28.8% لتقسيم خطوط المسار. بالإضافة إلى ذلك، قدمنا سيناريوهات حقيقية لتقييم أداء النموذج في بيئة حقيقية، والتي تتفوق بشكل كبير على المنافسين. هذا يدل على أن نموذجنا ليس فقط يتمتع بأداء تنافسي بل هو أيضًا أكثر مرونة وأسرع من النماذج المتعددة المهام الموجودة حاليًا. تم إصدار الكود المصدر والنماذج المدربة مسبقًا على الرابط: https://github.com/JiayuanWang-JW/YOLOv8-multi-task

تبحث مرة واحدة فقط للتعامل في الوقت الحقيقي والمهام المتعددة العامة | أحدث الأوراق البحثية | HyperAI