ديسكو باكس: التقطيع الشائع للأمثلة والمراسلة الدلالية من الإشراف الصندوقي

نقدم إطار عمل جديد يُسمى DiscoBox، والذي يقوم بتعلم تقسيم النماذج والتوافق الدلالي باستخدام إشراف الصناديق الحدودية. بشكل خاص، نقترح إطار عمل ذاتي التجميع حيث يتم توجيه تقسيم النماذج والتوافق الدلالي بشكل مشترك بواسطة معلم منظم بالإضافة إلى إشراف الصندوق الحدودي. يشمل المعلم نموذج طاقة منظم يدمج الاحتمال الثنائي والاحتمال بين الصور لنمذجة العلاقات الثنائية بين البكسلات داخل وعبر الصناديق. تقليل طاقة المعلم بشكل متزامن يؤدي إلى تحسين أقنعة الكائنات وإنشاء توافق كثيف بين الكائنات ضمن الفئة نفسها، والتي يتم استخدامها كتوصيات زائفة لإشراف شبكة المهام وتوفير أزواج توافق إيجابية/سالبة للتعلم التبايني الكثيف. نظهر علاقة تعايشية حيث تستفيد المهمتان من بعضهما البعض. أفضل نموذج لدينا حقق نسبة دقة 37.9% على تقسيم النماذج في مجموعة بيانات COCO، مما يتفوق على الطرق السابقة التي تعتمد على الإشراف الضعيف ويتنافس مع الطرق المشرف عليها. كما حصلنا على أفضل النتائج المعروفة في الإشراف الضعيف على مجموعتي بيانات PASCAL VOC12 و PF-PASCAL مع استدلال في الوقت الحقيقي.请注意,这里的一些术语如“instance segmentation”(实例分割)、“semantic correspondence”(语义对应)、“bounding box supervision”(边界框监督)等在阿拉伯语中可能没有统一的标准翻译,因此我使用了较为通用的翻译方法。如果需要进一步的专业术语校对,请告知。