HyperAIHyperAI

Command Palette

Search for a command to run...

الكشف التدريجي عن الكائنات من البداية إلى النهاية في المشاهد المزدحمة

Anlin Zheng Yuang Zhang Xiangyu Zhang Xiaojuan Qi Jian Sun

الملخص

في هذه الورقة، نقترح إطارًا جديدًا للكشف عن الحشود يستند إلى الاستفسارات (query-based). تعاني النماذج القائمة على الاستفسارات من عيبين رئيسيين: أولاً، يتم استنتاج تنبؤات متعددة لجسم واحد، خاصة في المشاهد المزدحمة؛ ثانيًا، تصل أداء النموذج إلى حد تشبع مع زيادة عمق مرحلة التفكيك (decoding). وبفضل طبيعة قاعدة تعيين التسمية ذات إلى واحد (one-to-one label assignment)، نقترح طريقة تنبؤ تدريجية (progressive predicting) لمعالجة هذه المشكلات. بشكل محدد، نبدأ بتحديد الاستفسارات المقبولة التي تميل إلى إنتاج تنبؤات صحيحة (true positive)، ثم نُحسّن الاستفسارات الضوضائية المتبقية بناءً على التنبؤات المقبولة السابقة. تُظهر التجارب أن طريقة العمل لدينا تُعزز بشكل كبير أداء النماذج القائمة على الاستفسارات في المشاهد المزدحمة. وباستخدام هذه الطريقة، تحقق Sparse RCNN أداءً بنسبة 92.0% في مقياس AP\text{AP}AP، و41.4% في مقياس MR2\text{MR}^{-2}MR2، و83.2% في مقياس JI\text{JI}JI على مجموعة بيانات التحدي CrowdHuman \cite{shao2018crowdhuman}، متفوقةً على الطريقة القائمة على المربعات (box-based) MIP \cite{chu2020detection} التي تُعدّ مخصصة لمعالجة السيناريوهات المزدحمة. علاوةً على ذلك، فإن الطريقة المقترحة، التي تتمتع بقدرة عالية على التحمل في ظل تراكم الحشود، تُحقق تحسينات متسقة أيضًا على مجموعات بيانات متوسطة وخفيفة التزاحم مثل CityPersons \cite{zhang2017citypersons} وCOCO \cite{lin2014microsoft}. سيتم إتاحة الشيفرة المصدرية للعامة عبر الرابط: https://github.com/megvii-model/Iter-E2EDET.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp