شبكة الوعي بالجودة السياقية الدلالية لتصنيف الصور بدقة عالية

استكشاف واستخراج الخصائص الدقيقة ولكن المميزة بين الفئات الفرعية ذات المظهر المتشابه أمر حاسم للتصنيف البصري الدقيق (FGVC). ومع ذلك، تم تخصيص جهد أقل لتقييم جودة التمثيلات البصرية المستخرجة. بشكل حدسي، قد يعاني الشبكة من صعوبة في التقاط الخصائص المميزة من العينات ذات الجودة المنخفضة، مما يؤدي إلى انخفاض كبير في أداء FGVC. لمواجهة هذا التحدي، نقترح شبكة واعية بالجودة السياقية والدلالية برقابة ضعيفة (CSQA-Net) للتصنيف البصري الدقيق.在这网络中,为了建模丰富部件描述符与全局语义之间的空间上下文关系,以捕捉对象内部更具区分性的细节,我们设计了一个新颖的多部件和多尺度交叉注意力模块 (MPMSCA). قبل إدخال البيانات إلى مódول MPMSCA، تم تطوير مُرشِّد الأجزاء لمعالجة مشاكل الالتباس في الحجم وتحديد المناطق المحلية المميزة بدقة. علاوة على ذلك، نقترح وحدة تقييم الجودة الدلالية متعددة المستويات (MLSQE) لإشراف تدريجي وتعزيز الدلالات الهرمية من مستويات مختلفة من شبكة العمود الفقري. أخيرًا، يتم إدخال الخصائص الواعية بالسياق من MPMSCA والخصائص المعززة دلاليًا من MLSQE إلى تصنيفات الكشف عن الجودة المقابلة لتقييم جودتها في الوقت الحقيقي، مما يعزز تمييز تمثيلات الخصائص. التجارب الشاملة على أربعة مجموعات بيانات FGVC شهيرة ومتنافسة بشدة تثبت تفوق الشبكة المقترحة CSQA-Net مقارنة بالطرق الأكثر تقدمًا.注:在最后一段中有一句中文,可能是误插入的。以下是修正后的版本:أخيرًا، يتم إدخال الخصائص الواعية بالسياق من MPMSCA والخصائص المعززة دلاليًا من MLSQE إلى تصنيفات الكشف عن الجودة المقابلة لتقييم جودتها في الوقت الحقيقي، مما يعزز تمييز تمثيلات الخصائص. التجارب الشاملة على أربعة مجموعات بيانات FGVC شهيرة ومتنافسة بشدة تثبت تفوق الشبكة المقترحة CSQA-Net مقارنة بالطرق الأكثر تقدمًا.