منذ 2 أشهر

تدريب نماذج معقدة باستخدام الإشراف الضعيف متعدد المهام

Alexander Ratner; Braden Hancock; Jared Dunnmon; Frederic Sala; Shreyash Pandey; Christopher Ré

الملخص

مع استمرار نماذج التعلم الآلي في زيادة تعقيدها، أصبح جمع مجموعات تدريب كبيرة ومصنفة يدويًا أحد أكبر العقبات في الممارسة العملية. بدلاً من ذلك، غالبًا ما يتم استخدام أشكال أضعف للإشراف تقدم تسميات أقل دقة ولكنها أرخص. ومع ذلك، فإن هذه مصادر الإشراف الأضعف لديها دقة متنوعة وغير معروفة، وقد تنتج تسميات ذات صلة، وقد تتخصص في تصنيف مهام مختلفة أو على مستويات مختلفة من التفصيل. نقترح إطارًا لدمج ونمذجة مثل هذه مصادر الإشراف الأضعف من خلال رؤيتها كمصدر لتسمية مهام فرعية متصلة بمشكلة، وهو ما نشير إليه باسم إعداد الإشراف الضعيف متعدد المهام (Multi-task Weak Supervision Setting). نوضح أنه من خلال حل مشكلة على غرار إكمال المصفوفة، يمكننا استعادة دقة هذه المصادر متعددة المهام بناءً على هيكل اعتمادها، ولكن دون أي بيانات مصنفة يدويًا، مما يؤدي إلى إشراف أعلى جودة لتدريب النموذج النهائي. نظريًا، نوضح أن خطأ التعميم لنماذج تم تدريبها بهذه الطريقة يتحسن مع زيادة عدد النقاط غير المصنفة، ونحدد كيفية التوسع بالنسبة لهيكل المهمة وهيكل الاعتماد. وفي ثلاثة مشاكل تصنيف دقيقة، نوضح أن طريقتنا تقود إلى زيادة متوسطة قدرها 20.2 نقطة في الدقة مقارنة بالنهج التقليدي بالإشراف الكامل (Supervised Approach)، و6.8 نقطة فوق أساسية تصويت الغالبية (Majority Vote Baseline)، و4.1 نقطة فوق طريقة الإشراف الضعيف المقترحة سابقًا التي تنمذج المهام بشكل منفصل (Separately Modeled Tasks).