HyperAIHyperAI

Command Palette

Search for a command to run...

العدّ الكائنات المحددة بالنص في عالم مفتوح

Niki Amini-Naieni Kiana Amini-Naieni Tengda Han Andrew Zisserman

الملخص

هدفنا هو العدّ الـ"عالم المفتوح" للأجسام في الصور، حيث يتم تحديد فئة الكائن المستهدف عبر وصف نصي. ولتحقيق هذا الهدف، نقترح نموذج CounTX، وهو نموذج أحادي المرحلة وغير مُخصص لفئة معينة، يستخدم رأسًا لعدّ الكائنات (counting head) مبنيًا على معالج ترانسפורمر فوق تمثيلات مسبقة التدريب للنص والصورة معًا. يتمكن نموذج CounTX من عدّ عدد مرات ظهور أي كائن، بالاعتماد فقط على صورة واحدة ووصف نصي لفئة الكائن المستهدف، ويمكن تدريبه بالكامل من البداية إلى النهاية. بالإضافة إلى هذا النموذج، نقدم المساهمات التالية: (i) قمنا بمقارنة أداء CounTX مع الأعمال السابقة في مجال العدّ الـ"عالم المفتوح" للأجسام، وبيّنا أن منهجنا يتفوق على أفضل النماذج الحالية في جميع المقاييس على معيار FSC-147 بالنسبة للطرق التي تستخدم النص لتحديد المهمة؛ (ii) قدمنا ونُشرنا FSC-147-D، وهي نسخة مُحسّنة من FSC-147 تضم وصفات نصية، مما يسمح بوصف فئات الكائنات بلغة أكثر تفصيلًا من مجرد أسماء فئات بسيطة. يمكن الوصول إلى FSC-147-D والكود المصدر على الرابط: https://www.robots.ox.ac.uk/~vgg/research/countx.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
العدّ الكائنات المحددة بالنص في عالم مفتوح | مستندات | HyperAI