التعلم من الجماهير من خلال نمذجة الالتباسات الشائعة

توفر منصات التجميع الجماعي طريقة عملية للحصول على كميات كبيرة من البيانات المُعلَّمة بتكاليف منخفضة. ومع ذلك، تختلف جودة التصنيف بين المُعلِّقين بشكل كبير، مما يفرض تحديات جديدة في تعلُّم نموذج عالي الجودة من خلال التصنيفات المستمدة من التجميع الجماعي. في هذا العمل، نقدّم منظورًا جديدًا لتفكيك ضجيج التصنيف إلى ضجيج شائع وضجيج فردي، ونميّز مصدر الارتباك بناءً على صعوبة المثال وخبرة المُعلِّق من منظور كل زوج (مثال-مُعلِّق). ونحقّق هذا النموذج الجديد للجمع الجماعي من خلال حل تعلّم متكامل (end-to-end) يحتوي على نوعين من طبقات التكيّف مع الضجيج: الأول يُشترَك بين جميع المُعلِّقين لالتقاط الارتباك المشترك بينهم، والثاني مخصص لكل مُعلِّق لتحقيق التكيّف مع الارتباك الفردي. ولتحديد مصدر الضجيج في كل تسمية، نستخدم شبكة مساعدة (auxiliary network) لاختيار الطبقتين المعنيتين بتكيف الضجيج وفقًا لكل من المثال والمتخصص. أظهرت تجارب واسعة على معايير مُصاغة اصطناعيًا وواقعية فعالية الحل المُقترح لتكييف الضجيج الشائع.