HyperAIHyperAI
منذ 19 أيام

تعلم الخصائص الفريدة للصف في التصنيف البصري الدقيق

Runkai Zheng, Zhijia Yu, Yinqi Zhang, Chris Ding, Hei Victor Cheng, Li Liu
تعلم الخصائص الفريدة للصف في التصنيف البصري الدقيق
الملخص

يُعد التحدي الرئيسي في التصنيف البصري الدقيق (FGVC) التمييز بين فئات متعددة ذات تشابه عالٍ بين الفئات من خلال تعلم الميزات التي تميز التفاصيل الدقيقة. وتُفشل الشبكات العصبية التلافيفية (CNN) المدربة باستخدام الدالة التقليدية للانحراف العشوائي (Cross Entropy) في تلبية هذا التحدي، إذ قد تؤدي إلى إنتاج ميزات غير متغيرة بين الفئات في سياق FGVC. في هذا العمل، نقترح بشكل مبتكر تنظيم تدريب الشبكة العصبية التلافيفية من خلال فرض فريدة الميزات لكل فئة من منظور نظري معلوماتي. لتحقيق هذا الهدف، نُصاغ خسارة دالة ماكسيمين (minimax loss) بناءً على إطار نظري لنظرية الألعاب، حيث أُثبت أن توازن ناش (Nash equilibrium) يتماشى مع هذا الهدف التنظيمي. بالإضافة إلى ذلك، ولمنع الحل الممكن لخسارة ماكسيمين الذي قد يؤدي إلى إنتاج ميزات زائدة، نقدّم خسارة تقليل التكرار في الميزات (FRL) تعتمد على الجداء الداخلي المعياري بين كل زوج من الخرائط المميزة المختارة، وذلك لتعزيز الخسارة المقترحة ماكسيمين. وتشير النتائج التجريبية المتفوقة على عدة معايير بارزة، إلى جانب التصوير البصري، إلى أن طريقتنا تستغل الأداء الكامل للنموذج الأساسي دون الحاجة إلى حسابات إضافية، وتحقق نتائج مماثلة للنماذج الحالية الأفضل في مجالها.

تعلم الخصائص الفريدة للصف في التصنيف البصري الدقيق | أحدث الأوراق البحثية | HyperAI