HyperAIHyperAI

Command Palette

Search for a command to run...

ShareGPT4V 大规模高质量图文数据集

Date

2 年前

Size

466.32 MB

Organization

University of Science and Technology of China
上海人工智能实验室

Publish URL

github.com

Paper URL

arxiv.org

License

CC BY-SA 4.0

Featured Image

ShareGPT4V 数据集是一个由大量图像-文本对组成的高质量数据集,它被用于训练视觉-语言模型 (VLM),以提高模型在图像理解和文本生成方面的能力。该数据集包含 120 万对图像-文本配对,这些数据有效地对齐了视觉和语言特征,增强了模型遵循指令的能力,并纳入了更多学术任务,例如 ScienceQA 、 TextVQA 、 SBU 等。通过引入这个数据集,模型在图像-文本对齐能力方面得到了显著提升,这对于多模态表示学习是一个关键方面。

该数据集是中国科学技术大学,上海人工智能实验室于 2023 年发布。

ShareGPT4V.torrent
Seeding 1Downloading 0Completed 159Total Downloads 294
  • ShareGPT4V/
    • README.md
      1.51 KB
    • README.txt
      3.03 KB
      • data/
        • ShareGPT4V.zip
          466.32 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供