استكشاف حدود نسخ السلوك للقيادة الذاتية

القيادة تتطلب الاستجابة لمجموعة واسعة من ظروف البيئة المعقدة وسلوكيات الوكلاء. من غير الواقعية نمذجة كل سيناريو محتمل بشكل صريح. بالمقابل، يمكن للتعلم بالتقليد، نظريًا، الاستفادة من بيانات أسطول كبير من السيارات التي يقودها البشر. وقد تم استخدام تقنية التكرار السلوكي بنجاح لتعلم سياسات بصرية-حركية بسيطة بطريقة شاملة، ولكن توسيع نطاقها ليشمل طيف السلوك القيادي الكامل لا يزال مشكلة غير محلولة. في هذا البحث، نقترح معيارًا جديدًا لدراسة قابلية التوسع والقيود المرتبطة بتقنية التكرار السلوكي تجريبيًا. نوضح أن التكرار السلوكي يؤدي إلى نتائج رائدة في مجالها، بما في ذلك في بيئات لم يتم اختبارها سابقًا، حيث يقوم بتنفيذ المناورات الجانبية والطولية المعقدة دون الحاجة إلى برمجة هذه الاستجابات بشكل صريح. ومع ذلك، فإننا نؤكد على القيود المعروفة جيدًا (بسبب تحيز مجموعة البيانات والتناسب الزائد)، وعلى مشاكل جديدة في التعميم (بسبب الأشياء الديناميكية ونقص النموذج السببي)، وعلى عدم استقرار التدريب الذي يتطلب المزيد من البحث قبل أن يمكن للتقنية أن تنتقل إلى القيادة الحقيقية في العالم الحقيقي. يمكن العثور على شفرة البرمجيات للتقنيات المدروسة للتكرار السلوكي على الرابط: https://github.com/felipecode/coiltraine .