日期

2 年前

大小

466.32 MB

数据集组织

发布 URL

github.com

论文 URL

arxiv.org

许可证

CC BY-SA 4.0

标签

ShareGPT4V 数据集是一个由大量图像-文本对组成的高质量数据集，它被用于训练视觉-语言模型 (VLM），以提高模型在图像理解和文本生成方面的能力。该数据集包含 120 万对图像-文本配对，这些数据有效地对齐了视觉和语言特征，增强了模型遵循指令的能力，并纳入了更多学术任务，例如 ScienceQA 、 TextVQA 、 SBU 等。通过引入这个数据集，模型在图像-文本对齐能力方面得到了显著提升，这对于多模态表示学习是一个关键方面。该数据集是中国科学技术大学，上海人工智能实验室于 2023 年发布。

Citation

@article{chen2023sharegpt4v, title={ShareGPT4V: Improving Large Multi-Modal Models with Better Captions}, author={Chen, Lin and Li, Jisong and Dong, Xiaoyi and Zhang, Pan and He, Conghui and Wang, Jiaqi and Zhao, Feng and Lin, Dahua}, journal={arXiv preprint arXiv:2311.12793}, year={2023} }

ShareGPT4V.torrent

Seeding 1Downloading 0Completed 211Total Downloads 367

ShareGPT4V/
- README.md
  1.51 KB
- README.txt
  3.03 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

Related Datasets

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集

在 Discord 上讨论

日期

2 年前

大小

466.32 MB

数据集组织

发布 URL

github.com

论文 URL

arxiv.org

许可证

CC BY-SA 4.0

标签

Citation

ShareGPT4V.torrent

Seeding 1Downloading 0Completed 211Total Downloads 367

ShareGPT4V/
- README.md
  1.51 KB
- README.txt
  3.03 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

ShareGPT4V 大规模高质量图文数据集

Citation

用 AI 构建 AI

HyperAI Newsletters

Command Palette

ShareGPT4V 大规模高质量图文数据集

Citation

Related Datasets

Verbatim Spans 查询条件证据提取数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

ChartNet 图表理解多模态数据集

EAVSD 电商广告视频分镜数据集

SMOL 多语言翻译平行数据集

ViMU 视频隐喻理解数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

LongBlocks 长上下文多语言问答数据集

Claw-Eval 真实世界评测基准数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

OmniParsingBench 多模态解析能力评估数据集

MDPBench 多语言文档解析基准数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

ShareGPT4V 大规模高质量图文数据集

Citation

Related Datasets

Verbatim Spans 查询条件证据提取数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

ChartNet 图表理解多模态数据集

EAVSD 电商广告视频分镜数据集

SMOL 多语言翻译平行数据集

ViMU 视频隐喻理解数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

LongBlocks 长上下文多语言问答数据集

Claw-Eval 真实世界评测基准数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

OmniParsingBench 多模态解析能力评估数据集

MDPBench 多语言文档解析基准数据集

用 AI 构建 AI

HyperAI Newsletters

Related Datasets

Verbatim Spans 查询条件证据提取数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

ChartNet 图表理解多模态数据集

EAVSD 电商广告视频分镜数据集

SMOL 多语言翻译平行数据集

ViMU 视频隐喻理解数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

LongBlocks 长上下文多语言问答数据集

Claw-Eval 真实世界评测基准数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

OmniParsingBench 多模态解析能力评估数据集

MDPBench 多语言文档解析基准数据集

Related Datasets

Verbatim Spans 查询条件证据提取数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

ChartNet 图表理解多模态数据集

EAVSD 电商广告视频分镜数据集

SMOL 多语言翻译平行数据集

ViMU 视频隐喻理解数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

LongBlocks 长上下文多语言问答数据集

Claw-Eval 真实世界评测基准数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

OmniParsingBench 多模态解析能力评估数据集

MDPBench 多语言文档解析基准数据集