HyperAIHyperAI
منذ 17 أيام

التعلم المتكرر متعدد التصنيفات للتصنيف الصوتي مع غموض التصنيف

Sai Rajeswar, Pau Rodriguez, Soumye Singhal, David Vazquez, Aaron Courville
التعلم المتكرر متعدد التصنيفات للتصنيف الصوتي مع غموض التصنيف
الملخص

أصبح التعلم المنقول من النماذج المُدرّبة مسبقًا على نطاق واسع أمرًا ضروريًا لعدد كبير من مهام الرؤية الحاسوبية. أظهرت دراسات حديثة أن مجموعات البيانات مثل ImageNet مُدرّبة بشكل ضعيف، حيث يتم تعيين تسمية واحدة فقط للصور التي تحتوي على فئات كائنات متعددة. يؤدي هذا الغموض إلى تحيز النماذج نحو تنبؤ واحد فقط، مما قد يُسبب تثبيط الفئات التي تميل إلى الظهور معًا في البيانات. مستوحى من الأدبيات المتعلقة بظهور اللغة، نقترح طريقة التعلم المتكرر متعدد التسميات (MILe) التي تدمج الانحيازات الاستنتاجية للتعلم متعدد التسميات من تسميات واحدة باستخدام إطار التعلم المتكرر. تُعدّ MILe إجراءً بسيطًا وفعّالًا يبني وصفًا متعدد التسميات للصورة من خلال نقل التنبؤات الثنائية عبر أجيال متتالية من الشبكات المُعلّمة والطلاب، مع وجود عقبة تعليمية (learning bottleneck). تُظهر التجارب أن منهجنا يحقق مزايا منهجية في دقة ImageNet وفي مؤشر F1 الخاص بـ ReaL، مما يدل على أن MILe تعامل مع الغموض في التسميات بشكل أفضل من الإجراءات التدريبية القياسية، حتى عند التخصيص الدقيق من خلال أوزان مُدرّبة ذاتيًا. كما نُظهر أن MILe فعّالة في تقليل الضوضاء في التسميات، وتحقيق أداءً رائدًا على بيانات واقعية كبيرة الحجم ذات ضوضاء مثل WebVision. علاوةً على ذلك، تحسّن MILe الأداء في البيئات التدريبية التدريجية حسب الفئة، مثل IIRC، وهي مقاومة جيدًا لتغيرات التوزيع. الكود: https://github.com/rajeswar18/MILe

التعلم المتكرر متعدد التصنيفات للتصنيف الصوتي مع غموض التصنيف | أحدث الأوراق البحثية | HyperAI