HyperAIHyperAI

Command Palette

Search for a command to run...

الاستخلاص الانتباهي المدرك للسياق (CAP) للتصنيف البصري الدقيق

Ardhendu Behera Zachary Wharton Pradeep Hewage Asish Bera

الملخص

أظهرت الشبكات العصبية التلافيفية العميقة (CNNs) قدرة قوية في استخراج معلومات مميزة حول وضع الأجسام وأجزائها لتقدير الصور. وفي التعرف الدقيق على الأصناف، تلعب التمثيلات الغنية بالسياق الخاصة بالكائن/المشهد دورًا محوريًا، نظرًا لوجود تباين كبير داخل نفس الفئة الفرعية، والتباين الدقيق بين الفئات الفرعية المختلفة. وتحديد التباين الدقيق الذي يُميّز الكائن/المشهد بشكل كامل ليس أمرًا سهلًا. ولحل هذه المشكلة، نقترح طريقة جديدة تُسمى "الاستخلاص الانتباهي المُدرك للسياق" (CAP)، التي تُمكن من التقاط التغيرات الدقيقة من خلال التدرجات تحت البكسل، وتعلّم التركيز على المناطق المتكاملة المفيدة وتقدير أهميتها في التمييز بين الفئات الفرعية المختلفة، دون الحاجة إلى مربعات حدودية (bounding-box) أو تسميات لأجزاء مميزة. كما نقدّم أيضًا طريقة جديدة لترميز الميزات، مع الأخذ بعين الاعتبار الاتساق الداخلي بين المعلوماتية للمناطق المتكاملة وبنية مكانتها المكانية، بهدف التقاط الارتباطات الدلالية بينها. تتميز طريقتنا بالبساطة والفعالية العالية، ويمكن تطبيقها بسهولة فوق شبكة أساسية قياسية للتصنيف. وقد قمنا بتقييم أسلوبنا باستخدام ست شبكات أساسية حديثة (SotA) وثمانية مجموعات بيانات معيارية. وقد تفوقت طريقتنا بشكل ملحوظ على أسلوب SotA في ستة من مجموعات البيانات، وتنافس بشكل قوي على المجموعتين المتبقيتين.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp