HyperAIHyperAI
منذ 2 أشهر

YOLACT: تقسيم الحالات في الوقت الحقيقي

Daniel Bolya; Chong Zhou; Fanyi Xiao; Yong Jae Lee
YOLACT: تقسيم الحالات في الوقت الحقيقي
الملخص

نقدم نموذجًا بسيطًا وشاملًا للتقسيم الفوري للعناصر يحقق دقة متوسطة تبلغ 29.8 على مجموعة بيانات MS COCO بمعدل 33.5 إطار في الثانية عند تقييمه على بطاقات Titan Xp الواحدة، وهو أسرع بكثير من أي نهج تنافسي سابق. علاوة على ذلك، نحصل على هذا النتيجة بعد التدريب باستخدام معالج واحد فقط من نوع GPU. نحقق هذا الإنجاز من خلال تقسيم عملية التقسيم إلى عنصرين فرعيين متوازيين: (1) إنشاء مجموعة من الأقنعة النموذجية (prototype masks)، و(2) التنبؤ بمعاملات الأقنعة لكل عنصر (per-instance mask coefficients). ثم ننتج أقنعة العناصر عن طريق الجمع الخطي بين النماذج الأولية ومعاملات الأقنعة. وقد اكتشفنا أن هذه العملية لا تعتمد على إعادة التجميع (repooling)، مما يجعل هذا النهج ينتج أقنعة ذات جودة عالية للغاية ويتميز بالثبات الزمني بشكل مجاني. بالإضافة إلى ذلك، قمنا بتحليل السلوك الناشئ لنماذجنا وأظهرنا أنها تتعلم تحديد مواقع العناصر بنفسها بطريقة متنوعة في الترجمة (translation variant)، رغم كونها شاملة تمامًا. وأخيرًا، نقترح أيضًا خوارزمية Fast NMS كبديل يمكن استخدامه مباشرة لخوارزمية NMS القياسية والتي تكون أسرع بمقدار 12 مللي ثانية مع وجود عقوبة أداء طفيفة فقط.