إحياء التدريب التكراري باستخدام التوجيه بالقناع للتقسيم التفاعلي

أظهرت الدراسات الحديثة المتعلقة بالتقسيم التفاعلي القائم على النقر نتائج من الدرجة الأولى باستخدام مختلف سchemes التحسين أثناء الاستدلال. تُعد هذه الطرق أكثر تكلفة من حيث الحوسبة مقارنة بالطرق المُقدمة من خلال التمرير الأمامي، حيث تتطلب إجراء عمليات تراجع (backward passes) عبر الشبكة أثناء الاستدلال، مما يجعل من الصعب نشرها على الإطارات المحمولة التي تدعم عادةً فقط العمليات الأمامية. في هذا البحث، قمنا بتقييم شامل لخيارات التصميم المختلفة في التقسيم التفاعلي، ووجدنا أنه يمكن تحقيق نتائج من الدرجة الأولى دون الحاجة إلى أي سchemes تحسين إضافية. ولهذا، نقترح نموذجًا بسيطًا مبنيًا على التمرير الأمامي للتقسيم التفاعلي القائم على النقر، والذي يستخدم أقنعة التقسيم من الخطوات السابقة. يتيح هذا النموذج ليس فقط تقسيم كائن جديد بالكامل، بل أيضًا بدء عملية من قناع خارجي وتصحيحه. عند تحليل أداء النماذج التي تم تدريبها على مجموعات بيانات مختلفة، لاحظنا أن اختيار مجموعة التدريب يؤثر بشكل كبير على جودة التقسيم التفاعلي. ووجدنا أن النماذج التي تم تدريبها على مزيج من COCO وLVIS، مع ملاحظات متنوعة وعالية الجودة، تُظهر أداءً أفضل من جميع النماذج الحالية. يمكن الوصول إلى الكود والنماذج المدربة من خلال الرابط التالي: https://github.com/saic-vul/ritm_interactive_segmentation.