منذ 7 أيام
WildQA: الإجابة على الأسئلة المتعلقة بالفيديوهات في البيئة الطبيعية
Santiago Castro, Naihao Deng, Pingxuan Huang, Mihai Burzo, Rada Mihalcea

الملخص
تركز مجموعات البيانات الحالية لفهم الفيديو بشكل أساسي على التفاعلات البشرية، مع اهتمام محدود بالسياقات "في البرية"، حيث يتم تسجيل الفيديوهات في الأماكن المفتوحة. نقترح مجموعة بيانات WILDQA، وهي مجموعة بيانات لفهم الفيديو تتضمن مقاطع مسجلة في البيئات الخارجية. بالإضافة إلى مهمة الإجابة على الأسئلة المرتبطة بالفيديو (Video QA)، نقدم أيضًا مهمة جديدة هي تحديد الدلائل البصرية الداعمة لسؤال واجابة معينين (Video Evidence Selection). من خلال التقييمات التي أجريت باستخدام طيف واسع من النماذج الأساسية، نُظهر أن WILDQA تطرح تحديات جديدة على مجتمعات البحث في الرؤية واللغة. تُتاح مجموعة البيانات عبر الرابط التالي: https://lit.eecs.umich.edu/wildqa/.