{ Wei Lu Ngai-Man Cheung Thilini Cooray}

الملخص
تميّز الحالة (SR) هو مهمة تعرف على الحركات بدرجة عالية من الدقة، حيث يُتوقع من النموذج أن لا يقتصر على توقع الحركة البارزة في الصورة فحسب، بل أيضًا توقع القيم الخاصة بجميع الأدوار الشكلية المرتبطة بهذه الحركة. وتمثّل مهمة توقع الأدوار الشكلية تحديًا كبيرًا، إذ يمكن أن توجد مجموعة واسعة من الاحتمالات التي تتوافق مع دور شكلي معين. وقد ركّزت الدراسات السابقة على هندسة نماذج التبعية لحل هذه المشكلة. مستوحين من النجاح الذي حققته أساليب الاستدلال البصري القائمة على الاستفسار (مثل الإجابة على الأسئلة البصرية)، نقترح معالجة توقع الأدوار الشكلية كمشكلة استدلال بصري قائمة على الاستفسار. ومع ذلك، لم تأخذ الأساليب الحالية القائمة على الاستفسار بعين الاعتبار معالجة الاستفسارات المترابطة، وهي ميزة فريدة تتطلبها مسألة توقع الأدوار الشكلية في مهام تميّز الحالة. وعليه، وبأفضل ما نعلم، نقدّم أول مجموعة من الأساليب التي تعالج الاستفسارات المترابطة في الاستدلال البصري القائم على الاستفسار. وأظهرت التجارب الواسعة فعالية المنهجية المقترحة، والتي حققت أداءً متميزًا في مهمة تميّز الحالة. علاوة على ذلك، وباستغلال الترابط بين الاستفسارات، تفوقت أساليبنا على منهجية حديثة متقدمة تُجيب عن الاستفسارات بشكل منفصل. رابط الكود: https://github.com/thilinicooray/context-aware-reasoning-for-sr
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| grounded-situation-recognition-on-swig | CAQ + RE-VGG | Top-1 Verb: 38.19 Top-1 Verb u0026 Value: 30.23 Top-5 Verbs: 65.05 Top-5 Verbs u0026 Value: 50.21 |
| situation-recognition-on-imsitu | CAQ + RE-VGG | Top-1 Verb: 38.19 Top-1 Verb u0026 Value: 30.23 Top-5 Verbs: 65.05 Top-5 Verbs u0026 Value: 50.21 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.