استخدام البيانات غير المصنفة لعد الجموع من خلال التعلم للتقييم

نقترح نهجًا جديدًا لعد الجموع يستفيد من الصور الغفيرة غير المصنفة المتاحة واسعًا في إطار التعلم للتصنيف (learning-to-rank). لاستخراج ترتيب للصور المقطعة، نستخدم الملاحظة التي تفيد بأن أي صورة جزئية لمشهد مكتظ بالأشخاص تضمن احتواؤها على نفس العدد أو عدد أقل من الأشخاص مقارنة بالصورة الأصلية. هذا يسمح لنا بمعالجة مشكلة حجم البيانات الموجودة المحدودة لعد الجموع. قمنا بجمع مجموعتين من بيانات مشاهد الجموع من غوغل باستخدام عمليات البحث عن الكلمات الرئيسية واسترجاع الصور عبر الاستفسار بالأمثلة، على التوالي. نوضح كيفية التعلم بكفاءة من هذه المجموعات غير المصنفة عن طريق دمج التعلم للتصنيف في شبكة متعددة المهام تقوم بتقييم الصور وتقدير خرائط كثافة الجموع بشكل متزامن. أظهرت التجارب على أصعب مجموعتين من بيانات عد الجموع أن نهجنا يحقق أفضل النتائج الحالية (state-of-the-art results).