HyperAIHyperAI
منذ 17 أيام

ألعاب تقليل المخاطر الثابتة

Kartik Ahuja, Karthikeyan Shanmugam, Kush R. Varshney, Amit Dhurandhar
ألعاب تقليل المخاطر الثابتة
الملخص

يُعد نموذج التقليل القياسي للمخاطر في التعلم الآلي هشًا عند العمل في بيئات تكون فيها توزيعات الاختبار مختلفة عن توزيع التدريب بسبب الارتباطات الوهمية. ويعمل التدريب على بيانات من بيئات متعددة وتحديد المُتنبئين الثابتين على تقليل تأثير السمات الوهمية من خلال تركيز النماذج على السمات التي تتمتع بعلاقة سببية مع النتيجة. في هذا العمل، نطرح مسألة التقليل من المخاطر الثابتة على أنها إيجاد توازن ناش (Nash equilibrium) في لعبة جماعية تضم عدة بيئات. وبفعل ذلك، نطور خوارزمية تدريب بسيطة تعتمد على ديناميات الاستجابة المثلى، ونُظهر في تجاربنا أنها تُحقّق دقة تجريبية مماثلة أو أفضل بانحراف معياري أقل بكثير من مشكلة التحسين ثنائي المستوى الصعبة التي قدمها أرْجوفسكي وآخرون (2019). من أبرز المساهمات النظرية هو إثبات أن مجموعة توازنات ناش للعبة المقترحة تساوي مجموعة المُتنبئين الثابتين لأي عدد منتهٍ من البيئات، حتى في حالة استخدام تصنيفات غير خطية والتحويلات غير الخطية. وبنتيجة ذلك، تُبقي خوارزميتنا على ضمانات التعميم لعدد كبير من البيئات التي أظهرها أرْجوفسكي وآخرون (2019). وتكمل الخوارزمية المقترحة المجموعة المتزايدة من الخوارزميات الناجحة في التعلم الآلي القائمة على نظرية الألعاب، مثل الشبكات التوليدية التنافسية (Generative Adversarial Networks).

ألعاب تقليل المخاطر الثابتة | أحدث الأوراق البحثية | HyperAI