HyperAI

التعلم التوافقي الهرمي (HRL) هو نهج في التعلم التوافقي يبني هيكلات صنع القرار متعددة المستويات لتفكيك المهام المعقدة إلى عدة مهام فرعية، مما يحسن كفاءة التعلم ويحل مشاكل الفضاء الحالة ذات الأبعاد العالية. يهدف HRL إلى تحسين المكافآت طويلة المدى، مما يمكّن من تنفيذ المهام بكفاءة ومرنة والتكيف مع البيئة. يتم تطبيقه على نطاق واسع في مجالات مثل توجيه الروبوتات، استراتيجيات الألعاب، وإدارة الموارد.

Ant + Maze

STAR

HyperAI

Ant + Maze

STAR

Command Palette

التعلم التدعيمي الهرمي

Command Palette

التعلم التدعيمي الهرمي

Command Palette

التعلم التدعيمي الهرمي