HyperAIHyperAI
منذ 7 أيام

ملحق ثلاثي الطبقات لتحسين الكشف عن التغطية

Guanqi Zhan, Weidi Xie, Andrew Zisserman
ملحق ثلاثي الطبقات لتحسين الكشف عن التغطية
الملخص

لا يزال الكشف عن الكائنات المُحجبَة يُشكّل تحديًا للكشف عن الكائنات الحديثة المتطورة. ويهدف هذا العمل إلى تحسين الكشف عن هذه الكائنات، وبالتالي تحسين الأداء العام لكاشف كائنات حديث.لتحقيق هذا الهدف، نقدّم أربع إسهامات رئيسية: (1) نقترح وحدة بسيطة من نوع "مُضافة مباشرة" (plugin) لرأس الكشف في كاشفات الكائنات ذات المرحلة الثانية، بهدف تحسين معدل الاسترجاع (recall) للكائنات التي تُحجب جزئيًا. تعتمد الوحدة على توقع قناع تجزئة مكوّن من ثلاث طبقات تمثل الكائن المستهدف، والجسم المُحجب، والجسم المُحجب به، مما يُمكّنها من توقع قناع الكائن المستهدف بشكل أكثر دقة. (2) نقترح نموذجًا قابلاً للتوسع لإنشاء بيانات تدريب للوحدة، باستخدام عملية استكمال غير مرئية (amodal completion) على مجموعات بيانات تدريب موجودة للكشف عن الكائنات وتقسيمها الحدودي (instance segmentation)، بهدف تحديد العلاقات المحجبة. (3) نُنشئ أيضًا مجموعة بيانات تقييم مخصصة لـ COCO لقياس أداء استرجاع الكائنات الجزئيًا المحجوبة أو المنفصلة. (4) نُظهر أن إدراج الوحدة المضافة في كاشف كائنات من نوع مرحلتين يؤدي إلى تحسين ملحوظ في الأداء، وذلك ببساطة من خلال تدريب رأس الكشف بشكل دقيق (fine-tuning)، مع تحسين إضافي عند تدريب كامل البنية المعمارية. وتُقدّم نتائج COCO لنموذج Mask R-CNN باستخدام أعمدة خلفية Swin-T أو Swin-S، وكذلك لنموذج Cascade Mask R-CNN باستخدام عمود خلفي Swin-B.

ملحق ثلاثي الطبقات لتحسين الكشف عن التغطية | أحدث الأوراق البحثية | HyperAI