HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

SAVE: الانتباه الذاتي على التضمين البصري للعد العام للأشياء بدون تدريب مسبق

{Nizar Bouguila Wassim Bouachir Ahmed Zgaren}

الملخص

يُعد العد الصفرية (Zero-shot counting) فئة فرعية من العد البصري العام للأجسام (Generic Visual Object Counting)، ويهدف إلى عد الأجسام من فئة عشوائية في صورة معينة. في حين يعتمد العد القائم على عدد قليل من الأمثلة (few-shot counting) على تقديم أمثلة مسبقة إلى النموذج لعد كائنات مشابهة من نفس الفئة، فإن العد الصفرية يُمكّن من أتمتة العملية لضمان معالجة أسرع. تقدم هذه الورقة طريقة صفرية متكاملة الأتمتة تتفوق على كل من الأساليب الصفرية والقليلة الأمثلة. من خلال استغلال خرائط الميزات (feature maps) المستمدة من نموذج أساسي مُدرّب مسبقًا بناءً على الكشف عن الكائنات، نُقدّم وحدة تضمين بصرية جديدة (Visual Embedding Module) صُممت لتوليد تضمينات معنوية ضمن سياق الكائنات. ثم يتم تمرير هذه التضمينات إلى وحدة مطابقة الانتباه الذاتي (Self-Attention Matching Module) لتوليد تمثيل مشفر لوحدة العد (الرأس العددي). وقد تفوقت الطريقة المقترحة على الأساليب الصفرية الحديثة، محققة أفضل نتائج في الخطأ المطلق المتوسط (MAE) والخطأ الجذري المتوسط (RMSE) على مجموعة بيانات FSC147، حيث بلغت القيم 8.89 و35.83 على التوالي. علاوة على ذلك، تُظهر الطريقة أداءً تنافسيًا مقارنة بالأساليب القليلة الأمثلة، مما يعزز القدرات في مجال العد البصري للأجسام في تطبيقات صناعية متنوعة مثل عد الأشجار، وعَد الحيوانات البرية، وغيرها.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
exemplar-free-counting-on-fsc147SAVE
MAE(test): 8.92
MAE(val): 8.89
RMSE(test): 80.39
RMSE(val): 35.83
few-shot-object-counting-and-detection-on-1SAVE
MAE(test): 8.92

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
SAVE: الانتباه الذاتي على التضمين البصري للعد العام للأشياء بدون تدريب مسبق | الأوراق البحثية | HyperAI