التمثيل الذاتي الفعّال للتحليل المعنوي

يُعرف أن مجموعة التنبؤات تُحقق أداءً أفضل مقارنة بالتنبؤات الفردية المُستقلة. ومع ذلك، في المهام التي تتطلب موارد حسابية كبيرة، مثل التجزئة الدلالية (semantic segmentation)، يكون إنشاء مجموعة من النماذج التي تحتاج إلى تدريب منفصل أمرًا شبه مستحيل من الناحية العملية. في هذا العمل، نقترح الاستفادة من الزيادة في الأداء التي تقدمها طرق المجموعة (ensemble methods) لتحسين التجزئة الدلالية، مع تجنب التكلفة العالية التقليدية المرتبطة بتدريب المجموعة. يعتمد نهجنا المُسمى "الجمع الذاتي" (self-ensemble) على الاستفادة من الميزات متعددة المقياس التي تُولِّدها طرق الشبكة الهرمية للسمات (feature pyramid network methods) لتقديم مدخلات إلى فكّات مستقلة، وبالتالي إنشاء مجموعة داخل نموذج واحد. وتمامًا كما في النماذج التقليدية للجمع، يتم الحصول على التنبؤ النهائي من خلال تجميع التنبؤات التي تُنتجها كل نموذج فرعي. على عكس الدراسات السابقة، يمكن تدريب نموذجنا بشكل متكامل من البداية إلى النهاية (end-to-end)، مما يقلل من التعقيد المرتبط بالتدريب متعدد المراحل التقليدي للجمع. يتفوق نهجنا المُعتمد على الجمع الذاتي على أحدث النماذج المُعلَّمة على مجموعتي بيانات المعايير Pascal Context وCOCO-Stuff-10K في مهمة التجزئة الدلالية، ويُظهر أداءً تنافسيًا على مجموعتي بيانات ADE20K وCityscapes. يُمكن الوصول إلى الكود مفتوح المصدر عبر الرابط: github.com/WalBouss/SenFormer.