HyperAIHyperAI

القياس المولد القائم على الفيديو (الفهم السياقي)

"القياس المعياري للأداء الجيني القائم على الفيديو (الفهم السياقي)" هو مهمة مصممة لتقييم أداء نماذج الحوار الفيديو الجينية في فهم السياق. تعتمد هذه المهمة على مجموعة بيانات ActivityNet-200، حيث يتم بناء مجموعة اختبار تحتوي على تسميات وصفية كثيفة غنية وأزواج أسئلة وإجابات تم توثيقها من قبل البشر. تستخدم هذه المهمة نموذج GPT-3.5 لتقييم التنبؤات المولدة، بهدف قياس فهم النموذج للمحتوى الفيديوي وقدراته الجينية بشكل شامل، مما يساهم في تحسين أداء أنظمة الحوار الفيديوي وتطوير تطبيقاتها.

القياس المولد القائم على الفيديو (الفهم السياقي) | SOTA | HyperAI