HyperAIHyperAI

Command Palette

Search for a command to run...

GPS-Net: شبكة استشعار الخصائص الرسومية لتكوين رسم المشهد

Xin Lin Changxing Ding Jinquan Zeng Dacheng Tao

الملخص

تهدف توليد رسم البيئة (SGG) إلى اكتشاف الكائنات في الصورة إلى جانب العلاقات الزوجية بينها. هناك ثلاث خصائص رئيسية لرسم البيئة لم تُستكشف بالكامل في الدراسات الحديثة: وهي على التوالي، معلومات اتجاه الحواف، والفرق في الأولوية بين العقد، وتوزيع العلاقات على شكل توزيع طويل đuّي (long-tailed distribution). وبناءً عليه، نقترح في هذه الورقة شبكة استشعار الخصائص الرسومية (GPS-Net) التي تستكشف بالكامل هذه الخصائص الثلاث. أولاً، نقترح وحدة تمرير رسالة جديدة تُضفي معلومات سياقية مخصصة لكل عقدة على ميزات العقدة، وتحدد معلومات اتجاه الحواف باستخدام نموذج ثلاثي الخطي (tri-linear model). ثانيًا، نُقدّم دالة خسارة حساسة لأولوية العقد، تعكس الفرق في الأولوية بين العقد أثناء التدريب. يتم ذلك من خلال تصميم دالة تطابق (mapping function) تُعدّل معامل التركيز في دالة الخسارة التركيزية (focal loss). ثالثًا، نظرًا لأن تكرار العلاقات يتأثر بمشكلة التوزيع الطويل ال đuّي، نخفف هذه المشكلة من خلال تليين التوزيع أولًا، ثم تمكين تعديله لكل زوج موضوع-كائن وفقًا لمعالمه البصرية. تُظهر التجارب المنهجية فعالية التقنيات المقترحة. علاوةً على ذلك، تحقق شبكة GPS-Net أداءً متقدمًا على أربع قواعد بيانات شهيرة: VG، OI، وVRD، بتحسن ملحوظ تحت مختلف الإعدادات والمقاييس. يُمكن الوصول إلى الشفرة والنموذج عبر الرابط التالي: \url{https://github.com/taksau/GPS-Net}.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp