HyperAIHyperAI

القياس المعياري للمولدات القائمة على الفيديو (الفهم الزمني)

"القياس المعياري للأداء الجيني القائم على الفيديو (الفهم الزمني)" هو مهمة مصممة لتقييم قدرات الفهم الزمني للنماذج الجينية للحوار الفيديوي. تُبنى هذه المهمة على مجموعة اختبار مستندة إلى مجموعة بيانات ActivityNet-200، والتي تشمل تسميات وصفية كثيفة وازدحام أسئلة وإجابات تم توضيحها من قبل البشر. يوفر خط الأنابيب للتقييم الذي تم تطويره باستخدام نموذج GPT-3.5 درجة نسبية من 1 إلى 5 للتنبؤات المولدة، بهدف قياس شامل لقدرة النموذج على فهم وتوليد المحتوى طوال خط زمن الفيديو، مما يعزز تجربة التفاعل بين الإنسان والكمبيوتر.

القياس المعياري للمولدات القائمة على الفيديو (الفهم الزمني) | SOTA | HyperAI