HyperAIHyperAI
منذ 17 أيام

تصحيح التسمية الميتا لتعلم التسميات الضوضائية

Guoqing Zheng, Ahmed Hassan Awadallah, Susan Dumais
تصحيح التسمية الميتا لتعلم التسميات الضوضائية
الملخص

استخدام الإشراف الضعيف أو المضطرب لبناء نماذج تعلم آلي فعّالة كان دائمًا أحد المشكلات البحثية المهمة. وقد زادت أهميته مؤخرًا بسبب الحاجة المتزايدة إلى مجموعات بيانات ضخمة لتدريب نماذج التعلم العميق. يمكن أن ينشأ الإشراف الضعيف أو المضطرب من مصادر متعددة، بما في ذلك مُعدّلي العلامات غير الخبراء، أو التسمية التلقائية المستندة إلى قواعد حدسية أو إشارات تفاعل المستخدم. هناك كمّ كبير من الأبحاث السابقة التي ركّزت على استغلال العلامات المضطربة. ومن أبرز هذه الأبحاث، أظهرت دراسات حديثة تحسينات ملحوظة باستخدام نهج إعادة توزين الأمثلة المستند إلى التعلم الميتا، حيث يُستخدم إطار التعلم الميتا لتعيين أوزان للعينات الخاصة بالعلامات المضطربة. في هذا البحث، نوسع هذا النهج من خلال صياغة المشكلة كمهمة تصحيح للعلامات ضمن إطار التعلم الميتا. ننظر إلى عملية تصحيح العلامات كعملية ميتا، ونُقدّم إطارًا جديدًا يعتمد على التعلم الميتا يُسمّى MLC (تصحيح العلامات الميتا) لتعلم النماذج مع العلامات المضطربة. وبشكل خاص، نستخدم شبكة تصحيح العلامات كنموذج ميتا لإنتاج علامات مصححة للعلامات المضطربة، بينما يُدرّس النموذج الرئيسي على الاستفادة من العلامات المصححة. يتم تدريب كلا النموذجين معًا من خلال حل مشكلة تحسين ثنائية المستوى. أجرينا تجارب واسعة على مستويات ونوعيات مختلفة من الضوضاء في العلامات، على مهام التعرف على الصور والتصنيف النصي. وقمنا بمقارنة نهج إعادة التوزين مع نهج التصحيح، وبيّنا أن صياغة التصحيح تعالج بعض القيود المرتبطة بإعادة التوزين. كما أظهرنا أن النهج المُقترح MLC يحقق تحسينات كبيرة مقارنة بالطرق السابقة في العديد من البيئات.