تعلم عد أي شيء: العد بدون مرجعية وبغض النظر عن الفئة باستخدام الإشراف الضعيف

الطرق الحالية للعد غير المرتبطة بالفئة قادرة على التعميم إلى فئات غير مألوفة، ولكنها عادةً ما تتطلب صورًا مرجعية لتحديد نوع الكائن الذي سيتم عده، بالإضافة إلى تسميات الأحداث خلال التدريب. العد غير المرتبط بالمرجعيات هو مجال ناشئ يحدد العد كمهمة أساسية للاعتراف بالتكرار. هذه الطرق تسهل العد في تركيبات مجموعات متغيرة. نوضح أن الفضاء المميز العام مع السياق العالمي يمكنه حصر الأحداث في الصورة دون الحاجة لمعرفة سابقة لنوع الكائن الموجود. تحديداً، نثبت أن الانحدار من خصائص محول الرؤية (Vision Transformer) بدون إشراف على مستوى النقاط أو صور مرجعية أفضل من باقي الطرق غير المرتبطة بالمرجعيات وأنه يتنافس مع الطرق التي تستعمل صورًا مرجعية. نظهر هذا على مجموعة البيانات القياسية الحالية FSC-147 للعد القليل الإطارات. كما نقترح مجموعة بيانات محسنة، FSC-133، والتي تزيل الأخطاء والغموض والصور المتكررة من FSC-147 ونظهر أداءً مشابهاً عليها. حسب علمنا، فإننا أول طريقة ضعيفة الإشراف وغير مرتبطة بالمرجعيات للعد غير المرتبط بالفئات.