HyperAIHyperAI
منذ 7 أيام

ISDA: التصنيف الوضعي للInstances باستخدام الانتباه القابل للتشويه

Kaining Ying, Zhenhua Wang, Cong Bai, Pengfei Zhou
ISDA: التصنيف الوضعي للInstances باستخدام الانتباه القابل للتشويه
الملخص

تُعد معظم نماذج التجزئة الحقيقية (instance segmentation) غير قابلة للتدريب من الطرف إلى الطرف (end-to-end) إما بسبب دمج تقدير المقترحات (RPN) كمعالجة مسبقة أو استخدام تثبيط الحد الأقصى غير المتبقي (NMS) كمعالجة لاحقة. ونُقدِّم في هذا العمل منهجًا جديدًا للتجزئة الحقيقية يُسمَّى ISDA. يعيد هذا المنهج تشكيل المهمة إلى توقع مجموعة من أقنعة الكائنات، والتي تُولَّد عبر العمليات التلافيفية التقليدية باستخدام نوى تعتمد على الموضع وتم تعلُّمها، إلى جانب خصائص الكائنات. وتُتعلَّم هذه النوى والخصائص من خلال الاستفادة من شبكة انتباه قابلة للانحناء (deformable attention network) التي تمتلك تمثيلًا متعدد المقياس. وبفضل الميزة المُقدَّمة في التنبؤ بالمجموعات (set-prediction mechanism)، يكون المنهج المقترح خاليًا من NMS. من الناحية التجريبية، يتفوَّق ISDA على Mask R-CNN (النموذج الأساسي القوي) بـ 2.6 نقطة على مجموعة بيانات MS-COCO، ويحقق أداءً رائدًا مقارنةً بالنماذج الحديثة. وسيكون الكود متاحًا قريبًا.

ISDA: التصنيف الوضعي للInstances باستخدام الانتباه القابل للتشويه | أحدث الأوراق البحثية | HyperAI