HyperAIHyperAI

Command Palette

Search for a command to run...

ELoPE: التصنيف البصري الدقيق مع التحديد الفعّال والتجميع والتمثيل

Harald Hanselmann Hermann Ney

الملخص

تتناول مهمة التصنيف البصري الدقيق (FGVC) مشكلات التصنيف التي تتميز بتمايز داخلي صغير بين الفئات، مثل التمييز بين أنواع الطيور المختلفة أو نماذج السيارات. تسعى الطرق المتطورة عادةً إلى معالجة هذه المشكلة من خلال دمج آلية انتباه معقدة أو طريقة لتحديد المواقع (أو أجزاء) داخل شبكة عصبية متعددة الطبقات (CNN) قياسية. وفي هذا العمل، يهدف إلى تحسين أداء شبكة CNN الأساسية مثل ResNet من خلال دمج ثلاثة مكونات فعالة وخفيفة الوزن مصممة خصيصًا لمهام FGVC. يتم ذلك باستخدام تقنية التجميع العالمي k-أقصى (global k-max pooling)، وطبقة تضمين تمييزية تم تدريبها من خلال تحسين المتوسطات الفئوية، بالإضافة إلى مُقدّر مربع حدودي فعّال يحتاج فقط إلى تسميات الفئات لتدريبه. ويحقق النموذج الناتج أفضل دقة في التعرف على الإطلاق على مجموعتي بيانات Stanford Cars وFGVC-Aircraft.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp