HyperAIHyperAI

Command Palette

Search for a command to run...

AutoCaption 视频字幕基准数据集

Discuss on Discord

Date

5 个月前

Paper URL

arxiv.org

License

Apache 2.0

AutoCaption 数据集由 Tjunlp 实验室于 2025 年发布的一个视频字幕基准数据集,相关论文成果为「Evaluating Multimodal Large Language Models on Video Captioning via Monte Carlo Tree Search」,旨在推动多模态大语言模型在视频字幕生成领域的研究。

数据集结构:

该数据集含 2 个子集,共 11,184 个样本:

  • sft_data: 用于字幕模型的监督微调(9,419 个样本用于监督微调数据)
  • mcts_vcb: 使用 MCTS 生成的标题和关键点进行评估(1,765 个样本用于评估 MCTS-VCB 基准)

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供