PointRend: التجزئة الصورية كعملية عرض

نُقدّم طريقة جديدة لتقسيم الصور عالي الجودة وذات كفاءة للأشياء والمشاهد. من خلال مقارنة الطرق الكلاسيكية في الرسوم الحاسوبية لتحسين عملية العرض مع التحديات المرتبطة بالاستخلاص الزائد أو الناقص للنقاط في مهام تسمية البكسل، نطور منظورًا فريدًا لتقسيم الصور باعتباره مشكلة عرض. ومن هذا المنظور، نقدّم وحدة الشبكة العصبية PointRend (العرض القائم على النقاط): وحدة تقوم بتوقعات تقسيم قائمة على النقاط في مواقع مختارة تلقائيًا باستخدام خوارزمية تقسيم تكرارية. يمكن تطبيق PointRend بمرن على مهام التقسيم الفردي والتقسيم الدلالي من خلال بناءها فوق النماذج الرائدة الحالية. وعلى الرغم من إمكانية تنفيذ العديد من التصميمات المحددة للفكرة العامة، نُظهر أن التصميم البسيط يحقق بالفعل نتائج ممتازة. من الناحية النوعية، تُنتج PointRend حدودًا واضحة للأشياء في المناطق التي كانت مُفرطة في التمويه في الطرق السابقة. ومن الناحية الكمية، تُحقّق PointRend تحسينات كبيرة على مجموعتي بيانات COCO وCityscapes، سواء في التقسيم الفردي أو التقسيم الدلالي. تُمكّن الكفاءة العالية لـ PointRend من إنتاج دقة عالية تُعدّ غير عملية من حيث الذاكرة أو الحوسبة مقارنة بالطرق الحالية. تم إتاحة الكود على الرابط التالي: https://github.com/facebookresearch/detectron2/tree/master/projects/PointRend.