خسارة ديناميكية للتعلم القوي

تترافق ضوضاء التسميات وعدم التوازن بين الفئات غالبًا في البيانات الواقعية. ومع ذلك، تركز الدراسات السابقة التي تهدف إلى التعلم المُتماسك على معالجة نوع واحد فقط من هذه الانحيازات في البيانات، مما يؤدي إلى أداء متدني عند مواجهة كلا النوعين معًا. لسد هذه الفجوة، تقدم هذه الدراسة خوارزمية جديدة قائمة على التعلم التماثلي (meta-learning) لحساب دالة الخسارة الديناميكية، والتي تُعدّل تلقائيًا دوال الهدف خلال عملية التدريب، بهدف تعلم فئة تصنيفية قوية من بيانات ذات توزيع طويل الذيل (long-tailed) تحتوي على ضوضاء في التسميات. وبشكل محدد، تتكوّن دالة الخسارة الديناميكية من مصحّح تسميات (label corrector) وواحدة لتكوين الحدود (margin generator)، حيث يُصحّح المُصحّح التسميات الخاطئة، بينما تُنشئ الوحدة الثانية حدودًا تصنيفية إضافية لكل فئة، وذلك من خلال تحليل التوزيع الكامن للبيانات والحالة التعلمية للصانع التصنيفي. وباستخدام استراتيجية عينة هرمية جديدة تُثري كمية صغيرة من البيانات غير المتحيزة بمجموعة متنوعة من العينات الصعبة، يتم تحسين المكونين معًا عبر التعلم التماثلي، مما يُسهم في تطوير صانع تصنيف قادر على التكيّف الجيد مع بيانات اختبار نظيفة متوازنة. أظهرت التجارب الواسعة أن طريقة العمل هذه تحقق دقة متقدمة على مستوى الحالة الحالية (state-of-the-art) على عدة مجموعات بيانات واقعية واصطناعية تتميز بأنواع مختلفة من الانحيازات في البيانات، بما في ذلك CIFAR-10/100، Animal-10N، ImageNet-LT، وWebvision. وسيتم قريبًا إتاحة الكود المصدر للعامة.