HyperAIHyperAI

القياس المعياري للFORMANCE المولد القائم على الفيديو

تقييم الأداء التوليدي القائم على الفيديو هو مهمة معيارية مصممة لتقييم الأداء التوليدي لنموذج حوار الفيديو بشكل شامل من خلال خمسة جوانب رئيسية: دقة المعلومات، التركيز على التفاصيل، فهم السياق، فهم الزمن، والاتساق. تقوم هذه المهمة ببناء مجموعة اختبار تعتمد على مجموعة بيانات ActivityNet-200، والتي تشمل فيديوهات غنية ومفصلة مع أزواج أسئلة وإجابات تم توثيقها من قبل البشر. كما يتم استخدام نموذج GPT-3.5 لتطوير أنبوب تقييم يوفر درجات نسبية من 1 إلى 5 للتنبؤات المولدة. يساعد هذا المعيار في تطوير وتحسين نماذج حوار الفيديو، مما يعزز أدائها في التطبيقات الحقيقية.

القياس المعياري للFORMANCE المولد القائم على الفيديو | SOTA | HyperAI