HyperAIHyperAI

Command Palette

Search for a command to run...

SOLOv2: التقطيع الشامل الديناميكي والسريع للنماذج

Xinlong Wang Rufeng Zhang Tao Kong Lei Li Chunhua Shen

الملخص

في هذا العمل، نهدف إلى بناء إطار بسيط ومباشر وسريع للتمييز بين النماذج (instance segmentation) مع أداء قوي. نتبع مبدأ طريقة SOLO التي وضعها وانغ وزملاؤه "SOLO: تمييز الأشياء حسب المواقع". وبشكل مهم، نخطو خطوة إضافية من خلال تعلم رأس القناع (mask head) للمقطع النموذجي (object segmenter) بشكل ديناميكي بحيث يكون رأس القناع مشروطاً بالموقع. تحديداً، يتم فصل فرع القناع إلى فرعين: فرع نواة القناع (mask kernel branch) وفرع خصائص القناع (mask feature branch)، اللذين يتحملان مسؤولية تعلم نواة التحويل (convolution kernel) وخواص التحويل (convolved features) على التوالي. بالإضافة إلى ذلك، نقترح Matrix NMS (القمع غير الأقصى باستخدام المصفوفات) لخفض الوقت الإضافي المستغرق في الاستدلال بسبب قمع الأقنعة غير القصوى. يقوم Matrix NMS لدينا بتنفيذ القمع غير الأقصى باستخدام عمليات المصفوفات المتوازية في خطوة واحدة، مما يؤدي إلى الحصول على نتائج أفضل. نوضح نظاماً بسيطاً ومباشراً للتمييز بين النماذج، حيث يتفوق على بعض الطرق الرائدة في السرعة والدقة. يعمل الإصدار الخفيف من SOLOv2 بمعدل 31.3 صورة في الثانية ويحقق دقة استدعاء بنسبة 37.1%. علاوة على ذلك، تظهر نتائجنا الرائدة في الكشف عن الأشياء (من خلال المنتج الثانوي للأقنعة) والتمييز البانورامي أن لديها القدرة على أن تكون أساساً قوياً جديداً لمهام التعرف على مستوى النموذج العديدة بخلاف التمييز بين النماذج. يمكن الوصول إلى الشيفرة البرمجية من الرابط التالي: https://git.io/AdelaiDet


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp