HyperAIHyperAI
منذ 2 أيام

NiceWebRL: مكتبة بايثون لتجارب الموضوعات البشرية مع بيئات التعلم القوي

Wilka Carvalho, Vikram Goddla, Ishaan Sinha, Hoon Shin, Kunal Jha
NiceWebRL: مكتبة بايثون لتجارب الموضوعات البشرية مع بيئات التعلم القوي
الملخص

نقدّم "NiceWebRL"، أداة بحثية تتيح للباحثين استخدام بيئات التعلم القوي الآلي (RL) في تجارب تجريبية إلكترونية على البشر. يُعدّ NiceWebRL مكتبة برمجية مكتوبة بلغة بايثون، تُمكّن أي بيئة تعتمد على Jax من التحويل إلى واجهة إلكترونية قابلة للتفاعل عبر الإنترنت، وتدعم كلًّا من البيئات ذات الوكيل الواحد والبيئات متعددة الوكلاء. وبذلك، يُمكّن NiceWebRL الباحثين في الذكاء الاصطناعي من مقارنة خوارزمياتهم بأداء البشر، والعلماء النفسيين المعرفيين من اختبار خوارزميات التعلم الآلي كنظريات لفهم التفكير البشري، كما يُمكّن الباحثين في مجالات الوكالات المتعددة من تطوير خوارزميات للتعاون بين الإنسان والذكاء الاصطناعي. ونُظهر إمكانات NiceWebRL من خلال ثلاث دراسات حالة، تُظهر تأثيرها المحتمل في تطوير أنواع من الذكاء الاصطناعي تماثل البشر، أو تكون متوافقة مع البشر، أو تُساعد البشر. في الدراسة الأولى (الذكاء الاصطناعي المُماثل للبشر)، يُمكّن NiceWebRL من تطوير نموذج جديد للتعلم القوي الآلي يُصوّر العمليات المعرفية. ويساعد هذا الأداة في اختبار هذا النموذج مقابل مشاركة مشاركين بشر في بيئة "مصفوفة الشبكة" (grid world) وفي بيئة Craftax، وهي بيئة ثنائية الأبعاد مستوحاة من لعبة Minecraft. أما في الدراسة الثانية (الذكاء الاصطناعي المتوافق مع البشر)، فيُمكّن NiceWebRL من تطوير خوارزمية جديدة متعددة الوكلاء في التعلم القوي الآلي، قادرة على التعميم على شراكة مع البشر في بيئة Overcooked. وأخيرًا، في الدراسة الثالثة (الذكاء الاصطناعي المساعد للبشر)، نُظهر كيف يمكن لـ NiceWebRL أن يمكّن الباحثين من دراسة كيفية مساعدة نموذج لغوي كبير (LLM) للبشر في إنجاز مهام معقدة داخل بيئة XLand-Minigrid، التي تضم ملايين المهام الهرمية. تُتاح المكتبة عبر الرابط التالي: https://url.