HyperAIHyperAI

Command Palette

Search for a command to run...

شبكة تلافيفية ديناميكية موجهة بالانتباه لتمييز الصور متعددة العلامات

Jin Ye Junjun He Xiaojiang Peng Wenhao Wu Yu Qiao

الملخص

الدراسات الحديثة غالباً ما تستغل شبكات التجميع الرسومية (GCN) لنمذجة اعتماديات التسميات بهدف تحسين دقة التعرف على الصور ذات التسميات المتعددة. ومع ذلك، قد يؤدي بناء الرسم البياني عن طريق عد إمكانية وجود التسميات معاً في بيانات التدريب إلى تدهور قابلية تعميم النموذج، خاصة عندما تكون هناك أشياء تتواجد مع بعضها بشكل متقطع في صور الاختبار. هدفنا هو القضاء على هذا الانحياز وتعزيز روبستية الخصائص المُتعلمة. لهذا الغرض، نقترح شبكة تجميع رسومية ديناميكية مدفوعة بالانتباه (ADD-GCN) لتوليد رسم بياني خاص لكل صورة بشكل ديناميكي. تعتمد ADD-GCN على شبكة تجميع رسومية ديناميكية (D-GCN) لنمذجة العلاقة بين تمثيلات الفئات التي تعتمد على المحتوى والمُنتجة بواسطة وحدة الانتباه الدلالي (SAM). أظهرت التجارب الواسعة على مقاييس متعددة للتسميات من المصادر العامة فعالية طريقتنا، حيث حققت معدلات mAP بلغت 85.2٪، 96.0٪، و95.5٪ على MS-COCO، VOC2007، وVOC2012 على التوالي، وأفضلت الأساليب الحالية الأكثر تقدماً بهامش واضح. يمكن العثور على جميع الأكواد في https://github.com/Yejin0111/ADD-GCN.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
شبكة تلافيفية ديناميكية موجهة بالانتباه لتمييز الصور متعددة العلامات | مستندات | HyperAI