تعلم توزيع التشابه المكاني لعد الأشياء في حالات القليل من العينات

يهدف العد القليل للأشياء (Few-shot object counting) إلى عد عدد الأشياء في صورة استعلام تابعة لنفس فئة الصور النموذجية المعطاة. تقوم الطرق الحالية بحساب التشابه بين صورة الاستعلام والصور النموذجية في المجال المكاني ثنائي الأبعاد (2D spatial domain) وتنفيذ الانحدار للحصول على عدد العناصر. ومع ذلك، فإن هذه الطرق تتجاهل المعلومات الغنية حول التوزيع المكاني للتشابه على الصور النموذجية، مما يؤدي إلى تأثير كبير على دقة التطابق. لحل هذه المشكلة، نقترح شبكة تتعلم توزيع التشابه المكاني (Spatial Similarity Distribution - SSD)، والتي تحتفظ ببنية الصور النموذجية المكانية وتحسب هرم تشابه رباعي الأبعاد (4D similarity pyramid) نقطة بنقطة بين ميزات الاستعلام وميزات الصور النموذجية، مما يتيح التقاط المعلومات الكاملة للتوزيع لكل نقطة في الفضاء الشبيهي رباعي الأبعاد. نقترح أيضًا وحدة تعلم التشابه (Similarity Learning Module - SLM) التي تنفذ الانثنائيات المركزية رباعية الأبعاد الكفوءة على هرم التشابه لربط مختلف توزيعات التشابه بقيم كثافة متوقعة مختلفة، وبالتالي الحصول على عد دقيق. بالإضافة إلى ذلك، نقدم أيضًا وحدة تعزيز الميزات المتقاطعة (Feature Cross Enhancement - FCE) التي تعزز ميزات الاستعلام والصور النموذجية بشكل متبادل لتحسين دقة التطابق بين الميزات. أثبتت طريقتنا أنها أفضل من أفضل الطرق الحالية في عدة قواعد بيانات، بما في ذلك FSC-147 وCARPK. يمكن الوصول إلى الكود من خلال الرابط: https://github.com/CBalance/SSD.