HyperAIHyperAI

Command Palette

Search for a command to run...

التعلم الرسومي المُفَكَّك المُدرك للنمط للربط العباري

Zongshen Mu Siliang Tang Jie Tan Qiang Yu Yueting Zhuang

الملخص

في هذه الورقة، نقترح إطارًا جديدًا للتعلم على الرسوم البيانية لتحديد موقع العبارات في الصور. بالانتقال من النموذج التسلسلي إلى النموذج الكثيف، تعاني الدراسات السابقة من القدرة على التقاط السياق المُجرَّد فقط، مع فشلها في التمييز بين تنوع السياقات بين العبارات والمناطق الصورية. على النقيض من ذلك، نولي اهتمامًا خاصًا بالأنماط المختلفة المُضمنة في سياق الرسم البياني للمنظر، ونُصمم شبكة رسم بياني منفصلة (Disentangled Graph Network) لدمج المعلومات السياقية المُدركة للأنماط في التمثيلات. بالإضافة إلى ذلك، نعتمد استراتيجيات تدخلية على مستويي الميزات والهيكل لتعزيز تمثيلات النموذج وجعلها أكثر عمومية. في النهاية، نستخدم شبكة الانتباه بين الوسائط لدمج الميزات داخل الوسائط، حيث يمكن حساب التشابه بين كل عبارة ومناطق الصورة لاختيار التمثيل المُثلى. ونُثبت كفاءة الشبكة الرسومية المنفصلة والتدخلية (DIGN) من خلال سلسلة من الدراسات التحليلية، وتحقق نماذجنا أداءً متميزًا على معايير Flickr30K Entities وReferIt Game.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp