HyperAIHyperAI
منذ 2 أشهر

فيزدوم: منصة بحثية للذكاء الاصطناعي تعتمد على دوم لتعلم التعزيز البصري

Michał Kempka; Marek Wydmuch; Grzegorz Runc; Jakub Toczek; Wojciech Jaśkowski
فيزدوم: منصة بحثية للذكاء الاصطناعي تعتمد على دوم لتعلم التعزيز البصري
الملخص

التطورات الحديثة في الشبكات العصبية العميقة أدت إلى تطوير طرق فعالة للتعلم التدعيمي القائم على الرؤية، والتي تم استخدامها للحصول على متحكمين بمستوى البشر في ألعاب Atari 2600 من بيانات البكسل. ومع ذلك، فإن ألعاب Atari 2600 لا تشبه المهام الحقيقية لأنها تتضمن بيئات ثنائية الأبعاد غير واقعية والمنظور الشخص الثالث. في هذا السياق، نقترح منصة اختبار جديدة للبحث في التعلم التدعيمي من المعلومات البصرية الخام التي تستعمل المنظور الشخص الأول في عالم ثلاثي الأبعاد شبه واقعي. يُعرف البرنامج باسم ViZDoom، وهو يستند إلى اللعبة الكلاسيكية لألعاب الفيديو من نوع "القناص الشخصي الأول" (First-Person Shooter)، وهي لعبة Doom. يسمح هذا البرنامج بتطوير روبوتات تلعب اللعبة باستخدام بافر الشاشة (Screen Buffer). يتميز ViZDoom بأنه خفيف الوزن، سريع، وقابل للتخصيص بشكل كبير عبر آلية مريحة للمenarios المستخدمين (User Scenarios). في الجزء التجريبي من البحث، قمنا باختبار البيئة من خلال محاولة تعلم روبوتات لسيناريوهين: مهمة أساسية تتضمن الحركة والرماية ومهمة أكثر تعقيدًا تتضمن التنقل في متاهة. باستخدام شبكات العصبونات العميقة المتلافهة مع التعلم Q والذاكرة التجريبية (Experience Replay)، تمكنا من تدريب روبوتات كفؤة لكل سيناريو، والتي تظهر سلوكًا مشابهًا للسلوك البشري. تؤكد النتائج فائدة ViZDoom كمنصة للأبحاث الذكاء الاصطناعي وتلمح إلى أن التعلم التدعيمي البصري في بيئات ثلاثية الأبعاد واقعية بالمنظور الشخص الأول هو أمر قابل للتنفيذ.

فيزدوم: منصة بحثية للذكاء الاصطناعي تعتمد على دوم لتعلم التعزيز البصري | أحدث الأوراق البحثية | HyperAI