Reinforcement Learning 1
التعلم التعزيزي (RL) هو طريقة لتدريب وكيل على زيادة الإشارة المكافأة التراكمية من خلال التفاعل مع بيئته. يتعلم الوكيل سياسة مثلى أو آلية اتخاذ قرارات عن طريق استلام ردود فعل على شكل مكافآت أو عقوبات، بهدف زيادة المكافآت على المدى الطويل. للتعلم التعزيزي تطبيقات مهمة في التحكم الآلي، الروبوتات، الألعاب، وإدارة الموارد.