HyperAIHyperAI
منذ 16 أيام

GPT-Driver: التعلم للقيادة باستخدام GPT

Jiageng Mao, Yuxi Qian, Junjie Ye, Hang Zhao, Yue Wang
GPT-Driver: التعلم للقيادة باستخدام GPT
الملخص

نُقدّم نهجًا بسيطًا ولكن فعّالًا يمكنه تحويل نموذج OpenAI GPT-3.5 إلى مخطط حركة موثوق للمركبات ذاتية القيادة. يُعدّ تخطيط الحركة أحد التحديات الأساسية في القيادة الذاتية، والهدف منه هو تخطيط مسار قيادة آمن ومرتاح. تعتمد معظم نماذج تخطيط الحركة الحالية على أساليب تجريبية (heuristic) لتوقع المسارات، لكن هذه النهج تُظهر قدرات تعميم غير كافية أمام السيناريوهات القيادة الجديدة وغير المسبوقة. في هذا البحث، نقترح نهجًا جديدًا لتخطيط الحركة يستفيد من قدرات الاستدلال القوية والقدرة على التعميم المتأصلة في النماذج الكبيرة للغة (LLMs). والرؤيا الأساسية في نهجنا هي إعادة صياغة مشكلة تخطيط الحركة كمشكلة نمذجة لغوية، وهي وجهة نظر لم تُستكشف سابقًا. وبشكل خاص، نمثل مدخلات ونواتج المخطط كرموز لغوية (tokens)، ونستخدم النموذج الكبير للغة لتوليد مسارات القيادة من خلال وصف لغوي لمواقع الإحداثيات. علاوةً على ذلك، نقترح استراتيجية جديدة تُسمى "التحفيز-الاستدلال-التحسين الدقيق" (prompting-reasoning-finetuning) لتحفيز القدرة على الاستدلال العددي للنموذج الكبير للغة. وباستخدام هذه الاستراتيجية، يمكن للنموذج أن يصف إحداثيات المسار بدقة عالية، كما يستطيع أن يشرح عملية اتخاذ القرار الداخلية له بلغة طبيعية. وقد قُمنا بتقييم نهجنا على مجموعة بيانات nuScenes الضخمة، وتوافرت نتائج تجارب واسعة تُثبت فعالية النموذج المبني على GPT، وقوته في التعميم، وقابلية تفسيره. وتم إتاحة الشفرة المصدرية الآن عبر الرابط التالي: https://github.com/PointsCoder/GPT-Driver.

GPT-Driver: التعلم للقيادة باستخدام GPT | أحدث الأوراق البحثية | HyperAI