HyperAIHyperAI
منذ 2 أشهر

SOLOv2: التقطيع الشامل الديناميكي والسريع للنماذج

Xinlong Wang; Rufeng Zhang; Tao Kong; Lei Li; Chunhua Shen
SOLOv2: التقطيع الشامل الديناميكي والسريع للنماذج
الملخص

في هذا العمل، نهدف إلى بناء إطار بسيط ومباشر وسريع للتمييز بين النماذج (instance segmentation) مع أداء قوي. نتبع مبدأ طريقة SOLO التي وضعها وانغ وزملاؤه "SOLO: تمييز الأشياء حسب المواقع". وبشكل مهم، نخطو خطوة إضافية من خلال تعلم رأس القناع (mask head) للمقطع النموذجي (object segmenter) بشكل ديناميكي بحيث يكون رأس القناع مشروطاً بالموقع. تحديداً، يتم فصل فرع القناع إلى فرعين: فرع نواة القناع (mask kernel branch) وفرع خصائص القناع (mask feature branch)، اللذين يتحملان مسؤولية تعلم نواة التحويل (convolution kernel) وخواص التحويل (convolved features) على التوالي. بالإضافة إلى ذلك، نقترح Matrix NMS (القمع غير الأقصى باستخدام المصفوفات) لخفض الوقت الإضافي المستغرق في الاستدلال بسبب قمع الأقنعة غير القصوى. يقوم Matrix NMS لدينا بتنفيذ القمع غير الأقصى باستخدام عمليات المصفوفات المتوازية في خطوة واحدة، مما يؤدي إلى الحصول على نتائج أفضل. نوضح نظاماً بسيطاً ومباشراً للتمييز بين النماذج، حيث يتفوق على بعض الطرق الرائدة في السرعة والدقة. يعمل الإصدار الخفيف من SOLOv2 بمعدل 31.3 صورة في الثانية ويحقق دقة استدعاء بنسبة 37.1%. علاوة على ذلك، تظهر نتائجنا الرائدة في الكشف عن الأشياء (من خلال المنتج الثانوي للأقنعة) والتمييز البانورامي أن لديها القدرة على أن تكون أساساً قوياً جديداً لمهام التعرف على مستوى النموذج العديدة بخلاف التمييز بين النماذج. يمكن الوصول إلى الشيفرة البرمجية من الرابط التالي: https://git.io/AdelaiDet