تجميع زمني قوي للتعلم مع علامات ضوضائية

إن تدريب الشبكات العصبية العميقة باستخدام بيانات مُعلّمة بضوضاء يُعدّ قدرة أساسية، نظرًا لأن معظم مجموعات البيانات في العالم الحقيقي تحتوي على نسبة من البيانات المُعلّمة خاطئًا. وإذا لم تُعالج هذه الضوضاء، فإنها تؤدي إلى تدهور حاد في أداء النماذج التعلّمية المُراقبة التقليدية. في هذا البحث، نقدّم طريقة "التركيب الزمني المُتماسك" (RTE)، التي تدمج دالة الخسارة المُتماسكة مع أساليب الت régularization شبه المُراقبة لتحقيق تعلّم مقاوم لضوضاء التسمية. ونُظهر أن RTE تحقق أداءً متفوّقًا على مستوى الحالة الحالية (state-of-the-art) عبر مجموعات بيانات CIFAR-10، CIFAR-100، ImageNet، WebVision، وFood-101N، مع التخلي عن الاتجاه الحديث المتمثل في تنقية أو تصحيح التسميات. وأخيرًا، نُبيّن أن RTE تُبقي على قدرة تنافسية في مقاومة التشويهات غير المتوقعة في المدخلات باستخدام مجموعة بيانات CIFAR-10-C، حيث تحقق خطأ تشويهًا متوسطًا (mCE) قدره 13.50% حتى عند نسبة ضوضاء تصل إلى 80%، مقابل 26.9% من خطأ التشويه المتوسط باستخدام الأساليب القياسية على بيانات نظيفة.