التصنيف الدقيق القصوى للإنتروبيا

التصنيف البصري الدقيق (FGVC) هو مشكلة مهمة في رؤية الحاسوب تتعلق بالتنوع البصري الصغير بين الفئات المختلفة، وغالبًا ما تتطلب مُعدّين خبراء لجمع البيانات. وباستخدام مفهوم التنوع البصري الصغير هذا، نعيد النظر في التعلم القائم على أقصى الانتروبيا في سياق التصنيف الدقيق، ونقدّم إجراءً تدريبيًا يُعدّل الانتروبيا القصوى لتوزيع الاحتمالات الناتجة عند تدريب الشبكات العصبية التلافيفية (CNN) على مهام التصنيف الدقيق. ونقدم تبريرًا نظريًا وتجريبيًا لنهجنا، ونحقق أداءً يُعدّ من أفضل الأداء في مجموعة متنوعة من مهام التصنيف ضمن مجال التصنيف الدقيق، ويمكن تمديد هذا الأسلوب إلى أي مهمة تكييف (fine-tuning). كما أن طريقة عملنا تتمتع بالمتانة تجاه قيم المُعاملات (hyperparameters) المختلفة، وكمية بيانات التدريب، وكمية الضوضاء في العلامات التدريبية، مما يجعلها أداة قيّمة في العديد من المشكلات المشابهة.