نمذجة الضوضاء التصنيفية غير المراقبة وتصحيح الخسارة

رغم صلابتها تجاه كميات صغيرة من الضوضاء في التسمية، فقد أظهرت الشبكات العصبية التلافيفية التي تم تدريبها باستخدام طرق التدرج العشوائي أنها قادرة على مطابقة التسميات العشوائية بسهولة. عند وجود خليط من الأهداف الصحيحة والمخطئة، تميل الشبكات إلى مطابقة الأولى قبل الثانية. هذا يشير إلى استخدام نموذج خليط مناسب ذو مكونين كنموذج جينيراتيفي غير مشرف للقيم الخسارة للعينات أثناء التدريب، مما يسمح بتقدير احتمالية أن تكون عينة معينة مخطئة بشكل متواصل. وبشكل خاص، نقترح استخدام الخليط البيتا لتقدير هذه الاحتمالية وتصحيح الخسارة بالاعتماد على تنبؤ الشبكة (وهو ما يعرف بخسارة البوتستراب). كما نقوم بتعديل تقنية التعزيز Mixup لدفع نهجنا خطوة إضافية للأمام. أظهرت التجارب على CIFAR-10/100 و TinyImageNet صلابة تجاه الضوضاء في التسمية تتفوق بشكل كبير على أفضل التقنيات الحديثة. يمكن الحصول على الكود المصدر من https://git.io/fjsvE