الفعالية غير المعقولة للبيانات الضوضائية في التعرف الدقيق

الطرق الحالية للاعتراف الدقيق تقوم بما يلي: أولاً، جذب الخبراء لتوثيق مجموعة من الصور، مع إمكانية جمع بيانات أكثر هيكلة على شكل توضيحات للأجزاء وصناديق الحدود. ثانياً، تدريب نموذج باستخدام هذه البيانات. بهدف حل مشكلة الاعتراف الدقيق، نقدم طريقة بديلة تعتمد على استخدام البيانات المجانية والضوضائية من الإنترنت وأساليب بسيطة وجامعة للتعارف. تتمتع هذه الطريقة بمزايا في الأداء والقابلية للتوسع. نثبت فعاليتها على أربع مجموعات بيانات دقيقة، حيث نتفوق بشكل كبير على أفضل النتائج الحالية دون الحاجة إلى جمع أي تصنيف يدوي، كما نظهر النتائج الأولى عند التوسع إلى أكثر من 10,000 فئة دقيقة. كمياتياً، حققنا دقة بنسبة 92.3% في CUB-200-2011 (CUB-200-2011)، و85.4% في Birdsnap (Birdsnap)، و93.4% في FGVC-Aircraft (FGVC-Aircraft)، و80.8% في Stanford Dogs (Stanford Dogs) دون استخدام مجموعات التدريب المصنفة لديهم. قمنا بمقارنة طريقتنا مع طريقة التعلم النشط لتوسيع مجموعات البيانات الدقيقة.