HyperAIHyperAI
منذ 2 أشهر

تصنيف الصور الفائقة البكسل باستخدام شبكات الانتباه الرسومية

Pedro H. C. Avelar; Anderson R. Tavares; Thiago L. T. da Silveira; Cláudio R. Jung; Luís C. Lamb
تصنيف الصور الفائقة البكسل باستخدام شبكات الانتباه الرسومية
الملخص

تعرض هذه الورقة منهجية لتصنيف الصور باستخدام نماذج الشبكات العصبية الرسومية (GNN). نحول الصور المدخلة إلى رسومات مجاورة للمناطق (RAGs)، حيث تكون المناطق نقاطاً فائقة (superpixels) والأطراف تربط النقاط الفائقة المجاورة. تشير تجاربنا إلى أن شبكات الانتباه الرسومية (GATs)، التي تجمع بين التوالف الرسومية وآليات الانتباه الذاتي، تتفوق على باقي نماذج GNN. رغم أن تصنيفات الصور الخام تؤدي بشكل أفضل من GATs بسبب فقدان المعلومات أثناء إنشاء RAGs، فإن منهجيتنا تفتح مسارًا بحثيًا مثيرًا في مجال التعلم العميق خارج صور الشبكة المستطيلة، مثل المناظر البانورامية ذات مجال الرؤية 360 درجة. لا يمكن لتوالف التقليدية للطرق الحالية الأكثر تقدمًا التعامل مع المناظر البانورامية، بينما يمكن للخوارزميات النقاط الفائقة المعدلة والرسومات المجاورة للمناطق الناتجة عنها تقديم بيانات لـ GNN بشكل طبيعي دون مشكلات طوبولوجية.

تصنيف الصور الفائقة البكسل باستخدام شبكات الانتباه الرسومية | أحدث الأوراق البحثية | HyperAI