HyperAIHyperAI

التعلم التدعيمي الهرمي

التعلم التوافقي الهرمي (HRL) هو نهج في التعلم التوافقي يبني هيكلات صنع القرار متعددة المستويات لتفكيك المهام المعقدة إلى عدة مهام فرعية، مما يحسن كفاءة التعلم ويحل مشاكل الفضاء الحالة ذات الأبعاد العالية. يهدف HRL إلى تحسين المكافآت طويلة المدى، مما يمكّن من تنفيذ المهام بكفاءة ومرنة والتكيف مع البيئة. يتم تطبيقه على نطاق واسع في مجالات مثل توجيه الروبوتات، استراتيجيات الألعاب، وإدارة الموارد.