HyperAIHyperAI
منذ 2 أشهر

حول خوارزميات التعلم الميتا من الدرجة الأولى

Alex Nichol; Joshua Achiam; John Schulman
حول خوارزميات التعلم الميتا من الدرجة الأولى
الملخص

يقوم هذا البحث بدراسة مشاكل التعلم الميتا (التعلم فوق)، حيث يوجد توزيع للمهام، ونرغب في الحصول على وكيل (عميل ذكاء اصطناعي) يحقق أداءً جيدًا (أي يتعلم بسرعة) عند مواجهته بمهمة لم يرها من قبل تم اختيارها من هذا التوزيع. نحلل عائلة من الخوارزميات لتعلم معلمات البداية التي يمكن تعديلها بسرعة على مهمة جديدة، باستخدام المشتقات الأولية فقط لتحديثات التعلم الميتا. هذه العائلة تشمل وتعمم MAML من الدرجة الأولى، وهي تقريب لميتا-التعلم MAML يتم الحصول عليه عن طريق تجاهل المشتقات الثانوية. كما تشمل خوارزمية Reptile، وهي خوارزمية جديدة نقدمها هنا، والتي تعمل عن طريق سحب مهمة بشكل متكرر، التدريب عليها، وتحريك معلمات البداية نحو الأوزان المدربة على تلك المهمة. نوسع في النتائج التي قدمتها Finn et al. والتي أظهرت أن خوارزميات التعلم الميتا من الدرجة الأولى تؤدي بشكل جيد في بعض المقاييس المعروفة للتصنيف القليل الطلقات (Few-shot classification)، ونقدم تحليلًا نظريًا يهدف إلى فهم الأسباب التي تجعل هذه الخوارزميات تعمل بكفاءة.

حول خوارزميات التعلم الميتا من الدرجة الأولى | أحدث الأوراق البحثية | HyperAI