منذ 7 أشهر

الملخص

التصنيف الدقيق للصور هو مهمة صعبة نظرًا لوجود توزيع هرمي من النوع الخشن إلى الدقيق في مجموعة البيانات. عادةً ما تُستخدم الأجزاء لتمييز الكائنات المختلفة في مجموعات البيانات الدقيقة، لكن ليس كل جزء مفيدًا أو ضروريًا. في السنوات الأخيرة، تم استخدام الوصف باللغة الطبيعية للحصول على معلومات حول الأجزاء التمييزية للكائن. تُركّز هذه الورقة على استخدام الوصف باللغة الطبيعية وتقترح استراتيجية لتعلم التمثيل المشترك بين الوصف باللغة الطبيعية والصور باستخدام شبكة ذات فرعين ومتعددة الطبقات، بهدف تحسين مهمة التصنيف الدقيق للصور. أظهرت التجارب الواسعة أن منهجنا يحقق تحسينات كبيرة في الدقة لمهام التصنيف الدقيق للصور. علاوةً على ذلك، حقق منهجنا نتائج جديدة في مستوى الحالة الحالية (state-of-the-art) على مجموعة بيانات CUB-200-2011.

ملف PDF المصدر عرض الكود

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار