HyperAIHyperAI

Command Palette

Search for a command to run...

التعلم بالتقليد

التعلم بالتقليد هو إطار لتعلم استراتيجيات سلوكية من خلال التوضيحات، حيث يتم تقديم بيانات التوضيح عادةً على شكل مسارات حالة-فعل. يهدف هذا الأسلوب إلى إنشاء خريطة قابلة للتعميم من الحالات إلى الأفعال من خلال التعلم الإشرافي (تقليد السلوك)، أو البحث عن دالة جائزة/تكلفة تحسّن القرارات في التوضيحات عبر التعلم العكسي للتعزيز (التعلم العكسي للتعزيز). تتعلم أحدث طرق التعلم العكسي Q-دالة الجودة مباشرة من بيانات الخبراء، مما يمثل الجائزة ضمنيًا، وبالتالي توفر السياسة المثلى على شكل توزيع بولتزمان. للتعلم بالتقليد قيمة تطبيقية كبيرة في مجالات الروبوتات والقيادة الذاتية وغيرها، حيث يعزز بشكل فعال قدرات اتخاذ القرار وكفاءة التنفيذ في الأنظمة.

لا توجد بيانات
لا توجد بيانات معيارية متاحة لهذه المهمة
التعلم بالتقليد | SOTA | HyperAI