HyperAIHyperAI
منذ 16 أيام

الكشف في المشاهد المزدحمة: اقتراح واحد، تنبؤات متعددة

Xuangeng Chu, Anlin Zheng, Xiangyu Zhang, Jian Sun
الكشف في المشاهد المزدحمة: اقتراح واحد، تنبؤات متعددة
الملخص

نُقدّم مُكتشف كائنات يعتمد على الاقتراحات، بسيط لكنه فعّال، ويهدف إلى اكتشاف الكائنات المتشابكة بشكل كبير في المشاهد المزدحمة. تكمن الفكرة الأساسية في منهجيتنا في تمكين كل اقتراح من توقع مجموعة من الكائنات المرتبطة ببعضها البعض، بدلًا من توقع كائن واحد فقط كما كان الحال في الإطارات السابقة القائمة على الاقتراحات. وباستخدام تقنيات جديدة مثل خسارة EMD وطريقة Set NMS، يمكن لمُكتشفنا التعامل بشكل فعّال مع الصعوبات الناتجة عن اكتشاف الكائنات المتشابكة بشدة. وباستخدام نموذج أساسي مبني على FPN-Res50، نحقّق مكاسب قدرها 4.9% في AP على مجموعة بيانات CrowdHuman الصعبة، وتحسينًا قدره 1.0% في $\text{MR}^{-2}$ على مجموعة بيانات CityPersons، دون الحاجة إلى أي إضافات مُتعدّدة. علاوةً على ذلك، يمكن لمنهجيتنا تحقيق تحسين متوسّط حتى على مجموعات بيانات أقل ازدحامًا مثل COCO، مما يدل على قدرة المنهجية المقترحة على التكيّف مع درجات مختلفة من الازدحام. سيتم إتاحة الشفرة البرمجية والنماذج المدربة مسبقًا على الرابط التالي: https://github.com/megvii-model/CrowdDetection.

الكشف في المشاهد المزدحمة: اقتراح واحد، تنبؤات متعددة | أحدث الأوراق البحثية | HyperAI