HyperAIHyperAI
منذ 12 أيام

درّب مخطّط طريق محلي في العالم الحقيقي خلال ساعة واحدة باستخدام تعلّم التقويم الجزئي المفصّل وتنوع مُتَعدّد مُتَوازٍ

Jinghao Xin, Jinwoo Kim, Zhi Li, Ning Li
درّب مخطّط طريق محلي في العالم الحقيقي خلال ساعة واحدة باستخدام تعلّم التقويم الجزئي المفصّل وتنوع مُتَعدّد مُتَوازٍ
الملخص

أظهر التعلم العميق التفاعلي (DRL) فعالية في حل مشكلة التخطيط الموضعي للمسار (LPP). ومع ذلك، يظل تطبيقه في العالم الحقيقي محدودًا جدًا بسبب ضعف كفاءة التدريب وقدرة التعميم لدى خوارزميات DRL. ولتخفيف هذين المشكلين، تم اقتراح حل يُسمى Color، والذي يتكون من إطار تدريب يُسمى Actor-Sharer-Learner (ASL) ومحاكي مُصمم خصيصًا للروبوتات المتنقلة يُدعى Sparrow. وبشكل خاص، يهدف ASL إلى تحسين كفاءة تدريب خوارزميات DRL من خلال استخدام نمط جمع البيانات المُتعددة المتجهات (VDC) لتسريع اكتساب البيانات، وفصل عملية جمع البيانات عن عملية تحسين النموذج باستخدام التعددية متعددة الخيوط، مع ربط جزئي بين العمليتين من خلال استخدام آلية تغذية راجعة زمنية (TFM)، وذلك لتجنب الاستخدام غير الكافي أو الزائد للبيانات. في المقابل، يستخدم محاكي Sparrow عالمًا مبنيًا على شبكة ثنائية الأبعاد، وديناميات مبسطة، وتدفق بيانات خالٍ من التحويل، مما يحقق تصميمًا خفيفًا. ويساهم هذا الخفة في تحقيق تنوع متجهي، مما يسمح بإنشاء إعدادات محاكاة متنوعة عبر نسخ واسعة من البيئات المتجهة، مما يؤدي إلى تحسين ملحوظ في قدرة التعميم للخوارزمية المدربة باستخدام DRL. وقد أُجريت تجارب شاملة تتضمن 57 بيئة معيارية لخوارزميات DRL، و32 سيناريو محاكاة و36 حالة واقعية لمشكلة التخطيط الموضعي للمسار، بهدف التأكيد على التفوق في الكفاءة والقدرة على التعميم. يمكن الوصول إلى الشيفرة والفيديو المرفقين بالورقة من خلال الرابط: https://github.com/XinJingHao/Color.

درّب مخطّط طريق محلي في العالم الحقيقي خلال ساعة واحدة باستخدام تعلّم التقويم الجزئي المفصّل وتنوع مُتَعدّد مُتَوازٍ | أحدث الأوراق البحثية | HyperAI