تصنيف الصور الدقيق الضعيف المراقب باستخدام التعلم التمييزي الموجه نموذج المزيج الغاوسي

تُستخدم الطرق الحالية لتمييز الصور الدقيقة المُدرَّسة بشكل ضعيف (WFGIR) عادةً استخلاص مناطق تمييزية من خرائط الميزات عالية المستوى مباشرةً. وجدنا أنه نظرًا لعملية تجميع مجالات الاستقبال المحلية، فإن الشبكات العصبية التلافيفية (CNN) تُسبب انتشارًا لمنطقة التمييز في خرائط الميزات عالية المستوى، مما يؤدي إلى تحديد غير دقيق لمواقع هذه المناطق. في هذه الورقة، نقترح نموذجًا مختلطًا غاوسيًا موجهًا للميزات التمييزية (DF-GMM) يعتمد على نهج من الطرف إلى الطرف (end-to-end)، لمعالجة مشكلة انتشار مناطق التمييز وتحديد تفاصيل دقيقة أفضل. وبشكل خاص، يتكون DF-GMM من: 1) آلية تمثيل منخفض الرتبة (LRM)، التي تتعلم مجموعة من القواعد التمييزية منخفضة الرتبة باستخدام نموذج المزيج الغاوسي (GMM) في خرائط الميزات الشكلية عالية المستوى، بهدف تحسين قدرة تمثيل الميزات التمييزية؛ و2) آلية إعادة تنظيم تمثيل منخفض الرتبة (LR²M)، التي تعيد استرجاع المعلومات المكانية المقابلة للقواعد التمييزية منخفضة الرتبة لإعادة بناء خرائط الميزات منخفضة الرتبة. ويُخفف هذا النموذج مشكلة انتشار مناطق التمييز، ويوفر تحديدًا أكثر دقة لمواقعها. وقد أثبتت التجارب الواسعة أن DF-GMM يحقق أفضل أداء تحت نفس الشروط مقارنةً بأفضل الطرق المنافسة، على مجموعات بيانات CUB-Bird وStanford-Cars وFGVC Aircraft.