HyperAIHyperAI

Command Palette

Search for a command to run...

الشبكات العصبية الثنائية للتمييز البصري الدقيق

Tsung-Yu Lin Aruni RoyChowdhury Subhransu Maji

الملخص

نقدم معمارية بسيطة وفعالة للتمييز البصري الدقيق تُعرف باسم شبكات العصبونات المتشابكة ثنائية الخطية (B-CNNs). تقوم هذه الشبكات بتمثيل الصورة كمنتج خارجي مشترك لميزات مستخرجة من شبكتين عصبيتين متشابكتين وتقضي على التفاعلات المحلية للميزات بطريقة ثابتة تحت الترجمة. تنتمي شبكات B-CNN إلى فئة تمثيلات النسيج غير المرتبة، ولكنها على عكس الأعمال السابقة يمكن تدريبها بطريقة شاملة من البداية إلى النهاية. يحقق نموذجنا الأكثر دقة نسبة صحة لكل صورة تبلغ 84.1٪، 79.4٪، 86.9٪ و91.3٪ على مجموعات البيانات Caltech-UCSD الطيور [67]، NABirds [64]، FGVC الطائرات [42]، وStanford السيارات [33] على التوالي، ويُشغل بمعدل 30 إطارًا في الثانية على معالج الرسومات NVIDIA Titan X.ثم نقدم تحليلًا منهجيًا لهذه الشبكات ونوضح أن (1) الميزات الثنائية شديدة الأهمية ويمكن تقليص حجمها بمقدار عشرين مرة دون فقدان كبير في الدقة، (2) أنها فعالة أيضًا لمهام تصنيف الصور الأخرى مثل تمييز النسيج والمشهد، و(3) يمكن تدريبها من الصفر على مجموعة بيانات ImageNet مع تقديم تحسينات ثابتة على الهيكل الأساسي.أخيرًا، نقدم تصورات لهذه النماذج باستخدام مجموعات البيانات المختلفة عن طريق استخدام أعلى التنشيطات للوحدات العصبية وتقنيات الانعكاس القائمة على التدرج. يمكن الحصول على الكود المصدر لنظام كامل من الرابط http://vis-www.cs.umass.edu/bcnn.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
الشبكات العصبية الثنائية للتمييز البصري الدقيق | مستندات | HyperAI