{Yi Yang Xiaohan Wang Linchao Zhu Yuanzhi Liang}

الملخص
فهم التعميم الشبكي والتمييز المميز للسمات يُعد مشكلة بحثية مفتوحة في التعرف البصري. تم إجراء العديد من الدراسات لتقييم جودة تمثيلات السمات. إحدى الاستراتيجيات البسيطة هي استخدام تصنيف خطي للتحقيق (Linear Probing Classifier) لتقييم كمي لدقة الفئة بناءً على السمات المُستخرجة. يُستخدم التحقيق الخطي النموذجي عادةً كمُعَوِّض في وقت الاستنتاج، ولكن فعاليته في قياس مدى ملاءمة السمات للتصنيف الخطي تُهمل إلى حد كبير أثناء التدريب. في هذا البحث، نقترح تصنيفًا خطيًا دوريًا (Episodic Linear Probing - ELP) يعكس تعميم التمثيلات البصرية بطريقة مباشرة أثناء التدريب. يتم تدريب ELP باستخدام سمات منفصلة عن الشبكة، ويُعاد تهيئة جزئيًا في كل دورة (episodic). ويُظهر ELP قدرة التمييز للتمثيلات البصرية أثناء التدريب. ثم نُقدّم مصطلحًا تقويمًا مناسبًا لـ ELP (ELP-SR)، والذي يعكس المسافات بين توزيعات الاحتمالات بين تصنيف ELP والتصنيف الرئيسي. يعتمد ELP-SR على عامل إعادة التحجيم لتنظيم كل عينة أثناء التدريب، مما يُعدّل دالة الخسارة بشكل تكيفي، ويشجع على توليد سمات تمييزية وعامة. لاحظنا تحسينات كبيرة في ثلاث مهام حقيقية للتعرف البصري، تشمل التصنيف البصري الدقيق، والتصنيف البصري بـ "الذيل الطويل"، والتصنيف العام للأجسام. تُظهر النتائج المحققة فعالية طريقتنا في تحسين التعميم الشبكي وتمييز السمات.
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| fine-grained-image-classification-on-cub-200-1 | ELP | Accuracy: 88.8 |
| fine-grained-image-classification-on-fgvc | ELP | Accuracy: 92.7 |
| fine-grained-image-classification-on-stanford | ELP | Accuracy: 94.2 |
| image-classification-on-imagenet | ELP (naive ResNet50) | Top 1 Accuracy: 76.13 |
| long-tail-learning-on-cifar-10-lt-r-10 | ELP | Error Rate: 11.3 |
| long-tail-learning-on-cifar-10-lt-r-100 | ELP | Error Rate: 22 |
| long-tail-learning-on-cifar-100-lt-r-10 | ELP | Error Rate: 40.9 |
| long-tail-learning-on-cifar-100-lt-r-100 | ELP | Error Rate: 57.6 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.