منذ 6 أشهر

الملخص

التحليل الطرفي هو مهمة أساسية في الرؤية الحاسوبية، حيث يُعيّن كل بكسل إلى فئة مناسبة ويُحدد مواقع الكائنات ضمن مربعات محددة. ومع ذلك، فإن جمع التسميات على مستوى البكسل يتطلب موارد زمنية ومالية أكثر من جمع التسميات الخاصة بالتصنيف أو الكشف. هنا، نقدم منهجية جديدة تُسمى "تحسين التدريجي للأقنعة باستخدام محول ذاتي التدريب (IMST)"، التي تُنفّذ تحليلًا طرفيًا غير مُدرَّب ويعتمد على الفئة (class agnostic) باستخدام تجميع K-أقرب جيران بسيط ومحول رؤية ذاتي التدريب. يقوم IMST بإنشاء تسميات افتراضية (Pseudo-ground-truth) يمكن استخدامها لتدريب نموذج تحليل طرفي جاهز. تُظهر التسميات الافتراضية أداءً محسّنًا على عدة مجموعات بيانات. ويُظهر النموذج المدرب على هذه التسميات الافتراضية أداءً أفضل من أحدث الطرق غير المُدرَّبة في تحليل الأطراف على مجموعة بيانات COCO20k (+4.0 نقطة دقة متوسطة (AP)) وعلى COCO val2017 (+2.6 AP)، دون أي تعديل على دالة الخسارة أو البنية المعمارية. ونُظهر أن طريقة العمل هذه يمكن توسيعها لتطبيقات أخرى مثل اكتشاف الكائنات الفردية/العديد من الكائنات، وتحسين التدريب المُراقب لتحليل الأطراف، مع تفوقها على الطرق السابقة.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار