HyperAIHyperAI

Command Palette

Search for a command to run...

WildQA: الإجابة على الأسئلة المتعلقة بالفيديوهات في البيئة الطبيعية

Santiago Castro Naihao Deng Pingxuan Huang Mihai Burzo Rada Mihalcea

الملخص

تركز مجموعات البيانات الحالية لفهم الفيديو بشكل أساسي على التفاعلات البشرية، مع اهتمام محدود بالسياقات "في البرية"، حيث يتم تسجيل الفيديوهات في الأماكن المفتوحة. نقترح مجموعة بيانات WILDQA، وهي مجموعة بيانات لفهم الفيديو تتضمن مقاطع مسجلة في البيئات الخارجية. بالإضافة إلى مهمة الإجابة على الأسئلة المرتبطة بالفيديو (Video QA)، نقدم أيضًا مهمة جديدة هي تحديد الدلائل البصرية الداعمة لسؤال واجابة معينين (Video Evidence Selection). من خلال التقييمات التي أجريت باستخدام طيف واسع من النماذج الأساسية، نُظهر أن WILDQA تطرح تحديات جديدة على مجتمعات البحث في الرؤية واللغة. تُتاح مجموعة البيانات عبر الرابط التالي: https://lit.eecs.umich.edu/wildqa/.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp