HyperAIHyperAI
منذ 11 أيام

K-means للفصل التلقائي للInstances باستخدام محول ذاتي التدريب

{Lee HongChul, Lee MinYoung, Park JaeEon, Lim SeongTaek}
الملخص

التحليل الطرفي هو مهمة أساسية في الرؤية الحاسوبية، حيث يُعيّن كل بكسل إلى فئة مناسبة ويُحدد مواقع الكائنات ضمن مربعات محددة. ومع ذلك، فإن جمع التسميات على مستوى البكسل يتطلب موارد زمنية ومالية أكثر من جمع التسميات الخاصة بالتصنيف أو الكشف. هنا، نقدم منهجية جديدة تُسمى "تحسين التدريجي للأقنعة باستخدام محول ذاتي التدريب (IMST)"، التي تُنفّذ تحليلًا طرفيًا غير مُدرَّب ويعتمد على الفئة (class agnostic) باستخدام تجميع K-أقرب جيران بسيط ومحول رؤية ذاتي التدريب. يقوم IMST بإنشاء تسميات افتراضية (Pseudo-ground-truth) يمكن استخدامها لتدريب نموذج تحليل طرفي جاهز. تُظهر التسميات الافتراضية أداءً محسّنًا على عدة مجموعات بيانات. ويُظهر النموذج المدرب على هذه التسميات الافتراضية أداءً أفضل من أحدث الطرق غير المُدرَّبة في تحليل الأطراف على مجموعة بيانات COCO20k (+4.0 نقطة دقة متوسطة (AP)) وعلى COCO val2017 (+2.6 AP)، دون أي تعديل على دالة الخسارة أو البنية المعمارية. ونُظهر أن طريقة العمل هذه يمكن توسيعها لتطبيقات أخرى مثل اكتشاف الكائنات الفردية/العديد من الكائنات، وتحسين التدريب المُراقب لتحليل الأطراف، مع تفوقها على الطرق السابقة.

K-means للفصل التلقائي للInstances باستخدام محول ذاتي التدريب | أحدث الأوراق البحثية | HyperAI