منذ 6 أشهر

الملخص

في حساب الحشود، تحتوي كل صورة تدريبية على عدد كبير من الأشخاص، حيث يتم وضع علامة نقطية على كل شخص. تعتمد الطرق الحالية لحساب الحشود على استخدام توزيع غاوسي لتنعيم كل نقطة مُعلَّمة أو لتقدير احتمالية كل بكسل بناءً على النقطة المُعلَّمة. في هذه الورقة، نُظهر أن تطبيق توزيع غاوسي على العلامات يُضعف أداء التعميم. بدلًا من ذلك، نقترح استخدام تقنية تُسمى "مطابقة التوزيع لحساب الحشود" (DM-Count). في DM-Count، نستخدم نقل الأمثل (Optimal Transport - OT) لقياس التشابه بين خريطة الكثافة المُقدَّرة المُعدَّلة وخرائط الكثافة الحقيقية المُعدَّلة. ولتحسين استقرار حسابات OT، نُضَمّن خسارة التباين الكلي (Total Variation loss) في نموذجنا. ونُظهر أن حد الخطأ في التعميم لـ DM-Count يكون أضيق من حدود الطرق التي تعتمد على تمويه غاوسي. من حيث متوسط الخطأ المطلق، تتفوّق DM-Count على أحدث الطرق المنشورة على مجموعتي بيانات كبيرتي الحجم UCF-QNRF وNWPU بفارق كبير، وتحقق أفضل النتائج على مجموعتي بيانات شانغهاي تك وUCF-CC50. كما أن DM-Count قلّصت خطأ النتائج المنشورة الأفضل في المجال بنسبة تقارب 16%. يمكن الوصول إلى الكود عبر الرابط: https://github.com/cvlab-stonybrook/DM-Count.

ملف PDF المصدر عرض الكود

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار