HyperAIHyperAI

Command Palette

Search for a command to run...

درّب مخطّط طريق محلي في العالم الحقيقي خلال ساعة واحدة باستخدام تعلّم التقويم الجزئي المفصّل وتنوع مُتَعدّد مُتَوازٍ

Jinghao Xin Jinwoo Kim Zhi Li Ning Li

الملخص

أظهر التعلم العميق التفاعلي (DRL) فعالية في حل مشكلة التخطيط الموضعي للمسار (LPP). ومع ذلك، يظل تطبيقه في العالم الحقيقي محدودًا جدًا بسبب ضعف كفاءة التدريب وقدرة التعميم لدى خوارزميات DRL. ولتخفيف هذين المشكلين، تم اقتراح حل يُسمى Color، والذي يتكون من إطار تدريب يُسمى Actor-Sharer-Learner (ASL) ومحاكي مُصمم خصيصًا للروبوتات المتنقلة يُدعى Sparrow. وبشكل خاص، يهدف ASL إلى تحسين كفاءة تدريب خوارزميات DRL من خلال استخدام نمط جمع البيانات المُتعددة المتجهات (VDC) لتسريع اكتساب البيانات، وفصل عملية جمع البيانات عن عملية تحسين النموذج باستخدام التعددية متعددة الخيوط، مع ربط جزئي بين العمليتين من خلال استخدام آلية تغذية راجعة زمنية (TFM)، وذلك لتجنب الاستخدام غير الكافي أو الزائد للبيانات. في المقابل، يستخدم محاكي Sparrow عالمًا مبنيًا على شبكة ثنائية الأبعاد، وديناميات مبسطة، وتدفق بيانات خالٍ من التحويل، مما يحقق تصميمًا خفيفًا. ويساهم هذا الخفة في تحقيق تنوع متجهي، مما يسمح بإنشاء إعدادات محاكاة متنوعة عبر نسخ واسعة من البيئات المتجهة، مما يؤدي إلى تحسين ملحوظ في قدرة التعميم للخوارزمية المدربة باستخدام DRL. وقد أُجريت تجارب شاملة تتضمن 57 بيئة معيارية لخوارزميات DRL، و32 سيناريو محاكاة و36 حالة واقعية لمشكلة التخطيط الموضعي للمسار، بهدف التأكيد على التفوق في الكفاءة والقدرة على التعميم. يمكن الوصول إلى الشيفرة والفيديو المرفقين بالورقة من خلال الرابط: https://github.com/XinJingHao/Color.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp