HyperAIHyperAI

Command Palette

Search for a command to run...

MiraData:具有长时长和结构化字幕的大规模视频数据集

Date

1 年前

Size

315.23 MB

Organization

The Chinese University of Hong Kong

Publish URL

github.com

Paper URL

arxiv.org

* 该数据集支持在线使用,点击此处跳转

MiraData 是由腾讯 PCG ARC Lab 与香港中文大学于 2024 年合作开发的大型视频数据集,专为长视频生成任务设计,论文成果为「MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions

与以往短视频剪辑不同,MiraData 专注于 1 至 2 分钟的未剪辑视频片段(平均时长 72.1 秒),每个视频都配有不同角度的结构化描述,描述平均长度为 318 个字,确保了视频内容的全面呈现。包括主体描述、背景、风格、摄像机运动、简短描述和密集描述六种类型的描述,增强了数据集的描述深度。

为了保证高质量的片段,研究团队根据美学、运动强度和颜色将数据集过滤为五个子集,选择视觉质量高且运动强度强的片段。为了获得详细且准确的描述,研究团队首先使用最先进的字幕生成器生成简短字幕,然后使用 GPT-4V 对其进行丰富,从而生成密集字幕。为了从多个角度提供细粒度的视频描述。

MiraData 数据集为长视频生成、视频内容理解与生成领域的研究者提供了宝贵的资源和新的挑战机遇。

MiraData.torrent
Seeding 1Downloading 0Completed 145Total Downloads 202
  • MiraData/
    • README.md
      2.02 KB
    • README.txt
      4.04 KB
      • data/
        • MiraData.zip
          315.23 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供