MTI-Net: شبكات تفاعل المهام متعددة المقياس للتعلم متعدد المهام

في هذه الورقة، نُقدّم حجّة حول أهمية أخذ التفاعلات بين المهام على مسcales متعددة بعين الاعتبار عند استخلاص معلومات المهام في بيئة تعلم متعدد المهام. على عكس الاعتقاد السائد، نُظهر أن المهام ذات الترابط العالي في مقياس معين ليست مضمونة الحفاظ على هذا السلوك عند المقياس الآخر، والعكس صحيح. نقترح معمارية جديدة تُسمى MTI-Net، تُبنى على هذا الاكتشاف بثلاث طرق. أولاً، تُعدّل التفاعلات بين المهام بشكل صريح على كل مقياس من خلال وحدة استخلاص متعددة المقياس ومتعددة النماذج. ثانيًا، تُمرّر المعلومات المُستخلصة عن المهام من المقياس الأدنى إلى المقياس الأعلى من خلال وحدة انتقال الميزات. ثالثًا، تُجمّع الميزات المُحسّنة للوظائف من جميع المقياسات من خلال وحدة تجميع الميزات لإنتاج التنبؤات النهائية لكل مهمة.أظهرت تجارب واسعة على مجموعتي بيانات متعدد المهام للتصنيف الكثيف أن نموذجنا متعدد المهام، على عكس الأبحاث السابقة، يحقّق الإمكانات الكاملة للتعلم متعدد المهام، أي: حجم ذاكرة أقل، عدد عمليات حسابية مُقلّص، وأداء أفضل مقارنة بالتعلم الفردي لكل مهمة. تم إتاحة الكود للجمهور: https://github.com/SimonVandenhende/Multi-Task-Learning-PyTorch.