HyperAIHyperAI

Command Palette

Search for a command to run...

ملحق ثلاثي الطبقات لتحسين الكشف عن التغطية

Guanqi Zhan Weidi Xie Andrew Zisserman

الملخص

لا يزال الكشف عن الكائنات المُحجبَة يُشكّل تحديًا للكشف عن الكائنات الحديثة المتطورة. ويهدف هذا العمل إلى تحسين الكشف عن هذه الكائنات، وبالتالي تحسين الأداء العام لكاشف كائنات حديث.لتحقيق هذا الهدف، نقدّم أربع إسهامات رئيسية: (1) نقترح وحدة بسيطة من نوع "مُضافة مباشرة" (plugin) لرأس الكشف في كاشفات الكائنات ذات المرحلة الثانية، بهدف تحسين معدل الاسترجاع (recall) للكائنات التي تُحجب جزئيًا. تعتمد الوحدة على توقع قناع تجزئة مكوّن من ثلاث طبقات تمثل الكائن المستهدف، والجسم المُحجب، والجسم المُحجب به، مما يُمكّنها من توقع قناع الكائن المستهدف بشكل أكثر دقة. (2) نقترح نموذجًا قابلاً للتوسع لإنشاء بيانات تدريب للوحدة، باستخدام عملية استكمال غير مرئية (amodal completion) على مجموعات بيانات تدريب موجودة للكشف عن الكائنات وتقسيمها الحدودي (instance segmentation)، بهدف تحديد العلاقات المحجبة. (3) نُنشئ أيضًا مجموعة بيانات تقييم مخصصة لـ COCO لقياس أداء استرجاع الكائنات الجزئيًا المحجوبة أو المنفصلة. (4) نُظهر أن إدراج الوحدة المضافة في كاشف كائنات من نوع مرحلتين يؤدي إلى تحسين ملحوظ في الأداء، وذلك ببساطة من خلال تدريب رأس الكشف بشكل دقيق (fine-tuning)، مع تحسين إضافي عند تدريب كامل البنية المعمارية. وتُقدّم نتائج COCO لنموذج Mask R-CNN باستخدام أعمدة خلفية Swin-T أو Swin-S، وكذلك لنموذج Cascade Mask R-CNN باستخدام عمود خلفي Swin-B.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
ملحق ثلاثي الطبقات لتحسين الكشف عن التغطية | مستندات | HyperAI