HyperAIHyperAI
منذ 17 أيام

SRRM: نموذج علاقة المنطقة الدلالية للتعرف على المشاهد الداخلية

Chuanxin Song, Xin Ma
SRRM: نموذج علاقة المنطقة الدلالية للتعرف على المشاهد الداخلية
الملخص

على الرغم من النجاح البارز للشبكات العصبية التلافيفية في مهام الرؤية الحاسوبية المختلفة، تظل عملية تمييز المشاهد الداخلية تحديًا كبيرًا نظرًا لتركيبها المعقد. ولهذا السبب، أصبح الاستفادة الفعالة من المعلومات الدلالية داخل المشهد أحد المحاور الأساسية في تطوير تقنيات تمييز المشاهد الداخلية. غير أن دقة تقسيم الدلالة (semantic segmentation) تظل محدودة، مما يحد من فعالية الطرق الحالية في الاستفادة من المعلومات الدلالية. ونتيجة لذلك، تظل معظم هذه الطرق عند مرحلة التسمية المساعدة أو إحصائيات التكرار المتبادل، مع قلة الاهتمام بالعلاقات السياقية المباشرة بين العناصر الدلالية داخل المشهد. في هذه الورقة، نقترح نموذج العلاقة بين المناطق الدلالية (Semantic Region Relationship Model - SRRM)، الذي يبدأ مباشرة من المعلومات الدلالية الموجودة داخل المشهد. وبشكل خاص، يعتمد SRRM على نهج تكيفي وفعال لتقليل الأثر السلبي للغموض الدلالي، ثم يُنشئ نموذجًا لعلاقة المناطق الدلالية بهدف تمييز المشهد. علاوةً على ذلك، ولاستغلال المعلومات الموجودة في المشهد بشكل أكثر شمولاً، ندمج النموذج المقترح SRRM مع وحدة PlacesCNN لإنشاء نموذج مدمج للعلاقة بين المناطق الدلالية (Combined Semantic Region Relation Model - CSRRM)، ونُقدّم منهجية جديدة لدمج المعلومات بهدف استكشاف المحتويات المكملة بين النموذجين بشكل فعّال. ويُظهر CSRRM أداءً متفوقًا بشكل ملحوظ مقارنة بالطرق الراقية (SOTA) على مجموعات بيانات MIT Indoor 67، والنسخة المختصرة من Places365، وSUN RGB-D، دون الحاجة إلى إعادة التدريب. يمكن الاطلاع على الكود المصدر من خلال الرابط التالي: https://github.com/ChuanxinSong/SRRM