HyperAIHyperAI
منذ 2 أشهر

التمييز الشائع في الصورة بمرة واحدة

Michaelis, Claudio ; Ustyuzhaninov, Ivan ; Bethge, Matthias ; Ecker, Alexander S.
التمييز الشائع في الصورة بمرة واحدة
الملخص

نواجه مشكلة التقطيع الشريطي لمرة واحدة (one-shot instance segmentation): بالنظر إلى صورة مثال لفئة كائنات جديدة وغير معروفة سابقًا، يجب العثور على وتقطيع جميع الكائنات لهذه الفئة داخل مشهد معقد. لمعالجة هذه المهمة الجديدة والصعبة، نقترح استخدام شبكة Siamese Mask R-CNN. تقوم هذه الشبكة بتوسيع نطاق Mask R-CNN بإضافة هيكل أساسي توأم (Siamese) يرمّز كل من الصورة المرجعية والمشهد، مما يسمح لها بتوجيه الكشف والتقطيع نحو الفئة المرجعية. نقدم نتائج تجريبية على مجموعة بيانات MS Coco تسلط الضوء على تحديات إعداد التقطيع الشريطي لمرة واحدة: بينما يعمل نقل المعرفة حول التقطيع الشريطي للأمثلة بشكل جيد للغاية في فئات الكائنات الجديدة، يبدو أن توجيه شبكة الكشف نحو الفئة المرجعية أكثر صعوبة. يقدم عملنا أول أساس قوي للتقطيع الشريطي لمرة واحدة ونتمنى أن يلهم المزيد من الأبحاث حول خوارزميات تحليل المشاهد الأكثر قوة ومرونة.الكود متاح على الرابط التالي: https://github.com/bethgelab/siamese-mask-rcnn