HyperAIHyperAI
منذ 11 أيام

SAVE: الانتباه الذاتي على التضمين البصري للعد العام للأشياء بدون تدريب مسبق

{Nizar Bouguila, Wassim Bouachir, Ahmed Zgaren}
الملخص

يُعد العد الصفرية (Zero-shot counting) فئة فرعية من العد البصري العام للأجسام (Generic Visual Object Counting)، ويهدف إلى عد الأجسام من فئة عشوائية في صورة معينة. في حين يعتمد العد القائم على عدد قليل من الأمثلة (few-shot counting) على تقديم أمثلة مسبقة إلى النموذج لعد كائنات مشابهة من نفس الفئة، فإن العد الصفرية يُمكّن من أتمتة العملية لضمان معالجة أسرع. تقدم هذه الورقة طريقة صفرية متكاملة الأتمتة تتفوق على كل من الأساليب الصفرية والقليلة الأمثلة. من خلال استغلال خرائط الميزات (feature maps) المستمدة من نموذج أساسي مُدرّب مسبقًا بناءً على الكشف عن الكائنات، نُقدّم وحدة تضمين بصرية جديدة (Visual Embedding Module) صُممت لتوليد تضمينات معنوية ضمن سياق الكائنات. ثم يتم تمرير هذه التضمينات إلى وحدة مطابقة الانتباه الذاتي (Self-Attention Matching Module) لتوليد تمثيل مشفر لوحدة العد (الرأس العددي). وقد تفوقت الطريقة المقترحة على الأساليب الصفرية الحديثة، محققة أفضل نتائج في الخطأ المطلق المتوسط (MAE) والخطأ الجذري المتوسط (RMSE) على مجموعة بيانات FSC147، حيث بلغت القيم 8.89 و35.83 على التوالي. علاوة على ذلك، تُظهر الطريقة أداءً تنافسيًا مقارنة بالأساليب القليلة الأمثلة، مما يعزز القدرات في مجال العد البصري للأجسام في تطبيقات صناعية متنوعة مثل عد الأشجار، وعَد الحيوانات البرية، وغيرها.

SAVE: الانتباه الذاتي على التضمين البصري للعد العام للأشياء بدون تدريب مسبق | أحدث الأوراق البحثية | HyperAI