HyperAI超神经

Video Based Generative Performance 2

Video-based Generative Performance Benchmarking (Detail Orientation) 是一项评估生成式视频对话模型详细导向能力的基准测试。该任务基于 ActivityNet-200 数据集,通过人类标注的丰富密集描述性字幕及其相关问答对构建测试集,并利用 GPT-3.5 模型开发评估管道,对生成预测进行 1-5 分的相对评分。旨在提升模型在细节理解与表达上的准确性和连贯性,为视频对话系统的性能优化提供重要参考。