HyperAIHyperAI
منذ 17 أيام

التصنيف البصري الدقيق العام من خلال التعلم الموجه بالمفاهيم

{Gui-Song Xia, Wei Ji, Beichen Zhou, Qi Bi}
الملخص

تُفترض في الطرق الحالية لتصنيف البصريات الدقيقة (FGVC) أن الدلالات الدقيقة تكمن في الأجزاء المفيدة ضمن الصورة. تعمل هذه الافتراضية بشكل جيد على الصور المركزة على الكائن وذات منظور أمامي مثالي، لكنها قد تواجه تحديات كبيرة في العديد من السياقات الواقعية، مثل الصور المركزة على المشهد (مثلاً: مشاهد الشارع) والمنظورات غير المثالية (مثلاً: إعادة تحديد الكائنات، الاستشعار عن بعد). في مثل هذه السياقات، يكون احتمال حدوث تنشيط غير دقيق أو مفرط للسمات (mis-/over-feature activation) مرتفعاً، مما قد يُربك عملية اختيار الأجزاء ويُضعف التمثيل الدقيق. في هذه الورقة، نحن متحفّزون لتصميم إطار عمل عالمي لتصنيف البصريات الدقيقة يناسب السياقات الواقعية. وبشكل دقيق، نقترح نموذجاً للتعلم المُوجَّه بالمعاني (CGL)، والذي يُمثّل المفاهيم الخاصة بفئة دقيقة معينة كمزيج من المفاهيم الموروثة من الفئة الأوسع المُدرجة تحتها، والمفاهيم التمييزية الخاصة بها. تُستخدم المفاهيم التمييزية لتوجيه عملية تعلّم التمثيل الدقيق. وبشكل خاص، تم تصميم ثلاث خطوات رئيسية: استخراج المفاهيم، دمج المفاهيم، وفرض قيود على المفاهيم. من ناحية أخرى، لسد الفجوة بين مجموعات بيانات FGVC في السياقات المركزة على المشهد والمنظورات غير المثالية، نقترح مجموعة بيانات جديدة لتصنيف التغطية الأرضية الدقيقة (FGLCD)، تحتوي على 59,994 عينة دقيقة. أظهرت التجارب الواسعة أن النموذج المقترح CGL: 1) يحقق أداءً تنافسياً على مهام FGVC التقليدية؛ 2) يحقق أفضل أداء مُسجّل حتى الآن على المشاهد الجوية الدقيقة والمشاهد الشارعية المركزة على المشهد؛ 3) يتمتع بقدرة عامة جيدة على مهام إعادة تحديد الكائنات وتحديد الكائنات الدقيقة في الصور الجوية. سيتم إتاحة مجموعة البيانات والكود المصدري على الرابط: https://github.com/BiQiWHU/CGL.

التصنيف البصري الدقيق العام من خلال التعلم الموجه بالمفاهيم | أحدث الأوراق البحثية | HyperAI