HyperAIHyperAI

Command Palette

Search for a command to run...

SUTD-TrafficQA: معيار إجابة الأسئلة وشبكة فعّالة للاستدلال على الفيديو حول الأحداث المرورية

Li Xu He Huang Jun Liu

الملخص

إن التعرف على الأحداث المرورية والاستدلال عليها في الفيديوهات يُعد مهمة مهمة تمتلك تطبيقات واسعة في النقل الذكي والقيادة المساعدة والمركبات ذاتية القيادة. في هذه الورقة البحثية، نُقدِّم مجموعة بيانات جديدة تُسمى SUTD-TrafficQA (الاستجابة على أسئلة المرور)، والتي تتخذ شكل استجابة الأسئلة المرتبطة بالفيديوهات، مبنية على 10,080 فيديو تم جمعها من البيئات الواقعية، مع 62,535 زوجًا من الأسئلة والإجابات المُعلَّمة، بهدف تقييم القدرة الإدراكية لنماذج الاستدلال السببي وفهم الأحداث في سيناريوهات المرور المعقدة. وبشكل خاص، نقترح 6 مهام استدلال صعبة تتوافق مع أنواع مختلفة من سيناريوهات المرور، بهدف تقييم القدرة على الاستدلال على مختلف الأحداث المرورية المعقدة والواقعة في الحياة الواقعية. علاوةً على ذلك، نقترح نموذجًا جديدًا يُسمى Eclipse، وهو شبكة فعالة للرؤية المُتعددة من خلال الاستدلال الديناميكي، بهدف تحقيق استدلال فيديو فعّال من حيث الحساب وموثوق. وتُظهر النتائج التجريبية أن طريقة العمل لدينا تحقق أداءً متفوقًا مع تقليل كبير في تكلفة الحساب. صفحة المشروع: https://github.com/SUTDCV/SUTD-TrafficQA.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
SUTD-TrafficQA: معيار إجابة الأسئلة وشبكة فعّالة للاستدلال على الفيديو حول الأحداث المرورية | مستندات | HyperAI