HyperAIHyperAI
منذ 16 أيام

GPS-Net: شبكة استشعار الخصائص الرسومية لتكوين رسم المشهد

Xin Lin, Changxing Ding, Jinquan Zeng, Dacheng Tao
GPS-Net: شبكة استشعار الخصائص الرسومية لتكوين رسم المشهد
الملخص

تهدف توليد رسم البيئة (SGG) إلى اكتشاف الكائنات في الصورة إلى جانب العلاقات الزوجية بينها. هناك ثلاث خصائص رئيسية لرسم البيئة لم تُستكشف بالكامل في الدراسات الحديثة: وهي على التوالي، معلومات اتجاه الحواف، والفرق في الأولوية بين العقد، وتوزيع العلاقات على شكل توزيع طويل đuّي (long-tailed distribution). وبناءً عليه، نقترح في هذه الورقة شبكة استشعار الخصائص الرسومية (GPS-Net) التي تستكشف بالكامل هذه الخصائص الثلاث. أولاً، نقترح وحدة تمرير رسالة جديدة تُضفي معلومات سياقية مخصصة لكل عقدة على ميزات العقدة، وتحدد معلومات اتجاه الحواف باستخدام نموذج ثلاثي الخطي (tri-linear model). ثانيًا، نُقدّم دالة خسارة حساسة لأولوية العقد، تعكس الفرق في الأولوية بين العقد أثناء التدريب. يتم ذلك من خلال تصميم دالة تطابق (mapping function) تُعدّل معامل التركيز في دالة الخسارة التركيزية (focal loss). ثالثًا، نظرًا لأن تكرار العلاقات يتأثر بمشكلة التوزيع الطويل ال đuّي، نخفف هذه المشكلة من خلال تليين التوزيع أولًا، ثم تمكين تعديله لكل زوج موضوع-كائن وفقًا لمعالمه البصرية. تُظهر التجارب المنهجية فعالية التقنيات المقترحة. علاوةً على ذلك، تحقق شبكة GPS-Net أداءً متقدمًا على أربع قواعد بيانات شهيرة: VG، OI، وVRD، بتحسن ملحوظ تحت مختلف الإعدادات والمقاييس. يُمكن الوصول إلى الشفرة والنموذج عبر الرابط التالي: \url{https://github.com/taksau/GPS-Net}.

GPS-Net: شبكة استشعار الخصائص الرسومية لتكوين رسم المشهد | أحدث الأوراق البحثية | HyperAI