HyperAIHyperAI
منذ 17 أيام

الاستخلاص الانتباهي المدرك للسياق (CAP) للتصنيف البصري الدقيق

Ardhendu Behera, Zachary Wharton, Pradeep Hewage, Asish Bera
الاستخلاص الانتباهي المدرك للسياق (CAP) للتصنيف البصري الدقيق
الملخص

أظهرت الشبكات العصبية التلافيفية العميقة (CNNs) قدرة قوية في استخراج معلومات مميزة حول وضع الأجسام وأجزائها لتقدير الصور. وفي التعرف الدقيق على الأصناف، تلعب التمثيلات الغنية بالسياق الخاصة بالكائن/المشهد دورًا محوريًا، نظرًا لوجود تباين كبير داخل نفس الفئة الفرعية، والتباين الدقيق بين الفئات الفرعية المختلفة. وتحديد التباين الدقيق الذي يُميّز الكائن/المشهد بشكل كامل ليس أمرًا سهلًا. ولحل هذه المشكلة، نقترح طريقة جديدة تُسمى "الاستخلاص الانتباهي المُدرك للسياق" (CAP)، التي تُمكن من التقاط التغيرات الدقيقة من خلال التدرجات تحت البكسل، وتعلّم التركيز على المناطق المتكاملة المفيدة وتقدير أهميتها في التمييز بين الفئات الفرعية المختلفة، دون الحاجة إلى مربعات حدودية (bounding-box) أو تسميات لأجزاء مميزة. كما نقدّم أيضًا طريقة جديدة لترميز الميزات، مع الأخذ بعين الاعتبار الاتساق الداخلي بين المعلوماتية للمناطق المتكاملة وبنية مكانتها المكانية، بهدف التقاط الارتباطات الدلالية بينها. تتميز طريقتنا بالبساطة والفعالية العالية، ويمكن تطبيقها بسهولة فوق شبكة أساسية قياسية للتصنيف. وقد قمنا بتقييم أسلوبنا باستخدام ست شبكات أساسية حديثة (SotA) وثمانية مجموعات بيانات معيارية. وقد تفوقت طريقتنا بشكل ملحوظ على أسلوب SotA في ستة من مجموعات البيانات، وتنافس بشكل قوي على المجموعتين المتبقيتين.

الاستخلاص الانتباهي المدرك للسياق (CAP) للتصنيف البصري الدقيق | أحدث الأوراق البحثية | HyperAI