القياس المعياري للFORMANCE المولد القائم على الفيديو
تقييم الأداء التوليدي القائم على الفيديو هو مهمة معيارية مصممة لتقييم الأداء التوليدي لنموذج حوار الفيديو بشكل شامل من خلال خمسة جوانب رئيسية: دقة المعلومات، التركيز على التفاصيل، فهم السياق، فهم الزمن، والاتساق. تقوم هذه المهمة ببناء مجموعة اختبار تعتمد على مجموعة بيانات ActivityNet-200، والتي تشمل فيديوهات غنية ومفصلة مع أزواج أسئلة وإجابات تم توثيقها من قبل البشر. كما يتم استخدام نموذج GPT-3.5 لتطوير أنبوب تقييم يوفر درجات نسبية من 1 إلى 5 للتنبؤات المولدة. يساعد هذا المعيار في تطوير وتحسين نماذج حوار الفيديو، مما يعزز أدائها في التطبيقات الحقيقية.