K-means للفصل التلقائي للInstances باستخدام محول ذاتي التدريب
التحليل الطرفي هو مهمة أساسية في الرؤية الحاسوبية، حيث يُعيّن كل بكسل إلى فئة مناسبة ويُحدد مواقع الكائنات ضمن مربعات محددة. ومع ذلك، فإن جمع التسميات على مستوى البكسل يتطلب موارد زمنية ومالية أكثر من جمع التسميات الخاصة بالتصنيف أو الكشف. هنا، نقدم منهجية جديدة تُسمى "تحسين التدريجي للأقنعة باستخدام محول ذاتي التدريب (IMST)"، التي تُنفّذ تحليلًا طرفيًا غير مُدرَّب ويعتمد على الفئة (class agnostic) باستخدام تجميع K-أقرب جيران بسيط ومحول رؤية ذاتي التدريب. يقوم IMST بإنشاء تسميات افتراضية (Pseudo-ground-truth) يمكن استخدامها لتدريب نموذج تحليل طرفي جاهز. تُظهر التسميات الافتراضية أداءً محسّنًا على عدة مجموعات بيانات. ويُظهر النموذج المدرب على هذه التسميات الافتراضية أداءً أفضل من أحدث الطرق غير المُدرَّبة في تحليل الأطراف على مجموعة بيانات COCO20k (+4.0 نقطة دقة متوسطة (AP)) وعلى COCO val2017 (+2.6 AP)، دون أي تعديل على دالة الخسارة أو البنية المعمارية. ونُظهر أن طريقة العمل هذه يمكن توسيعها لتطبيقات أخرى مثل اكتشاف الكائنات الفردية/العديد من الكائنات، وتحسين التدريب المُراقب لتحليل الأطراف، مع تفوقها على الطرق السابقة.