منذ 6 أشهر

الملخص

يقدم هذا البحث آلية انتباه قائمة على النقاط المميزة (keypoints-based attention mechanism) لتمييز الصور الثابتة. وقد أظهرت الشبكات العصبية العميقة ذات التحويلات التلافيفية (Deep Convolutional Neural Networks - CNNs) نجاحًا كبيرًا في التعرف على الصور ذات الفئات المميزة، ولكن أداؤها في التمييز بين التغيرات الدقيقة لا يزال غير متساوٍ مع المستوى المطلوب. ولحل هذه المشكلة، نقترح نموذجًا CNN يُدرَّب بشكل منتهي إلى منتهى (end-to-end)، يتعلم سمات ذات معنى تربط بين التغيرات الدقيقة من خلال آلية انتباه جديدة نقترحها. تعتمد هذه الآلية على استخلاص الهياكل المكانية في الصور من خلال تحديد مناطق ذات معنى (Semantic Regions - SRs) وتوزيعاتها المكانية، وقد أُثبت أن هذا العنصر يُعدّ المحور الأساسي في نمذجة التغيرات الدقيقة في الصور. ونقوم بتحديد هذه المناطق تلقائيًا من خلال تجميع النقاط المميزة المكتشفة في الصورة المعطاة. ونقيّم "القيمة المفيدة" لهذه المناطق لتمييز الصور باستخدام آلية انتباه مبتكرة تركز على الأجزاء الأكثر صلة بالمهام المحددة. ينطبق هذا الإطار على مهام التمييز التقليدي والدقيق للصور، ولا يتطلب مناطق مُعلّمة يدويًا (مثل مربعات حدودية لجزء من الجسم أو الأشياء، إلخ) أثناء التدريب أو التنبؤ. علاوةً على ذلك، يمكن دمج آلية الانتباه المُشَغَّلة بالنقاط المميزة بسهولة في النماذج الحالية من الشبكات العصبية العميقة. وقد تم تقييم الإطار على ستة مجموعات بيانات معيارية متنوعة، حيث تفوق النموذج الأداء المتميز في المجالات الحالية بفارق كبير، وذلك باستخدام مجموعات بيانات: Distracted Driver V1 (دقة: 3.39٪)، Distracted Driver V2 (دقة: 6.58٪)، Stanford-40 Actions (متوسط دقة التصنيف: 2.15٪)، People Playing Musical Instruments (متوسط دقة التصنيف: 16.05٪)، Food-101 (دقة: 6.30٪)، وCaltech-256 (دقة: 2.59٪).

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Asish Bera Zachary Wharton Yonghuai Liu Nik Bessis Ardhendu Behera

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Asish Bera Zachary Wharton Yonghuai Liu Nik Bessis Ardhendu Behera

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Asish Bera Zachary Wharton Yonghuai Liu Nik Bessis Ardhendu Behera

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

Attend and Guide (AG-Net): شبكة عميقة قائمة على الانتباه تُوجّه بواسطة نقاط المفتاح للتصنيف الصوتي

Asish Bera Zachary Wharton Yonghuai Liu Nik Bessis Ardhendu Behera

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

Attend and Guide (AG-Net): شبكة عميقة قائمة على الانتباه تُوجّه بواسطة نقاط المفتاح للتصنيف الصوتي

Asish Bera Zachary Wharton Yonghuai Liu Nik Bessis Ardhendu Behera

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

Attend and Guide (AG-Net): شبكة عميقة قائمة على الانتباه تُوجّه بواسطة نقاط المفتاح للتصنيف الصوتي

Asish Bera Zachary Wharton Yonghuai Liu Nik Bessis Ardhendu Behera

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters