HyperAIHyperAI
منذ 7 أيام

WildQA: الإجابة على الأسئلة المتعلقة بالفيديوهات في البيئة الطبيعية

Santiago Castro, Naihao Deng, Pingxuan Huang, Mihai Burzo, Rada Mihalcea
WildQA: الإجابة على الأسئلة المتعلقة بالفيديوهات في البيئة الطبيعية
الملخص

تركز مجموعات البيانات الحالية لفهم الفيديو بشكل أساسي على التفاعلات البشرية، مع اهتمام محدود بالسياقات "في البرية"، حيث يتم تسجيل الفيديوهات في الأماكن المفتوحة. نقترح مجموعة بيانات WILDQA، وهي مجموعة بيانات لفهم الفيديو تتضمن مقاطع مسجلة في البيئات الخارجية. بالإضافة إلى مهمة الإجابة على الأسئلة المرتبطة بالفيديو (Video QA)، نقدم أيضًا مهمة جديدة هي تحديد الدلائل البصرية الداعمة لسؤال واجابة معينين (Video Evidence Selection). من خلال التقييمات التي أجريت باستخدام طيف واسع من النماذج الأساسية، نُظهر أن WILDQA تطرح تحديات جديدة على مجتمعات البحث في الرؤية واللغة. تُتاح مجموعة البيانات عبر الرابط التالي: https://lit.eecs.umich.edu/wildqa/.

WildQA: الإجابة على الأسئلة المتعلقة بالفيديوهات في البيئة الطبيعية | أحدث الأوراق البحثية | HyperAI