التصنيف البصري الدقيق مع التحسين عالي درجة الحرارة وقمع الخلفية

التصنيف البصري الدقيق يُعد مهمة صعبة بسبب التشابه العالي بين الفئات والاختلافات الكبيرة بين البيانات داخل فئة واحدة. ولحل هذه التحديات، ركزت الاستراتيجيات السابقة على تحديد الفروق الدقيقة بين الفئات وتعزيز السمات التمييزية فيها. ومع ذلك، فإن الخلفية تقدم أيضًا معلومات مهمة يمكن أن تُخبر النموذج بأي سمات تكون غير ضرورية أو حتى ضارة للتصنيف، كما أن النماذج التي تعتمد بشكل مفرط على السمات الدقيقة قد تتجاهل السمات الشاملة والمعلومات السياقية. في هذه الورقة، نقترح شبكة جديدة تُسمى "تحسين درجة الحرارة العالية وقمع الخلفية" (HERBS)، والتي تتكون من وحدتين: وحدة تحسين درجة الحرارة العالية ووحدة قمع الخلفية، لاستخلاص السمات التمييزية وقمع ضجيج الخلفية على التوالي. تسمح وحدة تحسين درجة الحرارة العالية للنموذج بتعلم مقاييس السمات المناسبة من خلال تحسين خريطة السمات عند مقاييس مختلفة وتحسين تعلم السمات المتنوعة. أما وحدة قمع الخلفية، فتقوم أولاً بفصل خريطة السمات إلى جزء أمامي وجزء خلفي باستخدام درجات ثقة التصنيف، ثم تقلل من قيم السمات في المناطق ذات الثقة المنخفضة، في حين تعزز السمات التمييزية. أظهرت النتائج التجريبية أن HERBS تُحقّق دمجًا فعّالًا للسمات بمقاييس مختلفة، وتقمع ضجيج الخلفية، وتحدد السمات التمييزية عند مقاييس مناسبة لتصنيف بصري دقيق. وحققت الطريقة المقترحة أداءً من الدرجة الأولى على مجموعتي البيانات CUB-200-2011 وNABirds، حيث تجاوزت دقة التصنيف 93% في كلا المجموعتين. وبالتالي، تُعد HERBS حلاً واعدًا لتحسين أداء مهام التصنيف البصري الدقيق. الكود: https://github.com/chou141253/FGVC-HERBS