العد متعدد المصادر ومتعدد المقاييس في صور الحشود الكثيفة جدًا

نُقترح الاستفادة من مصادر متعددة للمعلومات لحساب تقدير لعدد الأشخاص الموجودين في زحمة كثيفة للغاية تُرى في صورة واحدة. نظرًا للمشكلات التي تشمل المنظور، والانسداد، والتشويش، وعدد قليل من البكسلات لكل شخص، فإن عدّ البشر عن طريق كشف الأشخاص في مثل هذه الصور أمر شبه مستحيل. بدلًا من ذلك، تعتمد طريقةنا على مصادر متعددة مثل كشف الرؤوس ذات الثقة المنخفضة، وتكرار عناصر النسيج (باستخدام SIFT)، وتحليل المجال الترددي لتقدير العدد، جنبًا إلى جنب مع الثقة المرتبطة برؤية الأفراد في منطقة معينة داخل الصورة. ثانيًا، نستخدم قيدًا تكامليًا عالميًا على العدادات باستخدام حقل ماركوف العشوائي (Markov Random Field). وهذا يعالج التباين في العدادات ضمن الجيران المحليين، وكذلك عبر المقياسات المختلفة. وقد تم اختبار طريقتنا على مجموعة بيانات جديدة تتكون من خمسين صورة زحمة تحتوي على 64 ألف شخص تم وضع العلامات عليهم، حيث تتراوح أعداد الرؤوس بين 94 و4543. ويختلف هذا بشكل كبير عن مجموعات البيانات المستخدمة في الطرق الحالية، التي لا تحتوي على أكثر من عشرات الأشخاص. ونُظهر تجريبيًا كفاءة وموثوقية الطريقة المقترحة من خلال قياس أداء العد.