WIT 图像-文本数据集

数据集下载 磁力链 下载帮助

WIT 全称 Wikipedia-based Image Text,是一个大型多模态多语言数据集。该数据集由 3,760 万个实体丰富的图像-文本示例的精选集组成,其中包含 108 种 Wikipedia 语言中的 1,150 万 个唯一图像。该数据集的规模使其可以用作多模态机器学习模型的预训练数据集。

WIT 具有四个独特优势:

  • 根据图像文本示例的数量,WIT 是最大的多模式数据集,
  • 涵盖了 100 多种语言(每种语言至少有 12,000 个示例),并为许多图像提供了跨语言文本。
  • 相对于以前的数据集,WIT 代表了一组更多样化的概念和现实世界实体。
  • WIT 提供了一个非常具有挑战性的真实世界测试集。
1 做种 0 下载 41 已完成
  • WIT/README.md 1.41 KB
  • WIT/README.txt 1.41 KB
  • WIT/data/test/wit_v1.test.all-00000-of-00005.tsv.gz 30.8 MB
  • WIT/data/test/wit_v1.test.all-00001-of-00005.tsv.gz 30.66 MB
  • WIT/data/test/wit_v1.test.all-00002-of-00005.tsv.gz 30.48 MB
  • WIT/data/test/wit_v1.test.all-00003-of-00005.tsv.gz 30.55 MB
  • WIT/data/test/wit_v1.test.all-00004-of-00005.tsv.gz 30.64 MB
  • WIT/data/train/wit_v1.train.all-00000-of-00010.tsv.gz 2.49 GB
  • WIT/data/train/wit_v1.train.all-00001-of-00010.tsv.gz 2.48 GB
  • WIT/data/train/wit_v1.train.all-00002-of-00010.tsv.gz 2.49 GB
  • WIT/data/train/wit_v1.train.all-00003-of-00010.tsv.gz 2.49 GB
  • WIT/data/train/wit_v1.train.all-00004-of-00010.tsv.gz 2.48 GB
  • WIT/data/train/wit_v1.train.all-00005-of-00010.tsv.gz 2.49 GB
  • WIT/data/train/wit_v1.train.all-00006-of-00010.tsv.gz 2.49 GB
  • WIT/data/train/wit_v1.train.all-00007-of-00010.tsv.gz 2.49 GB
  • WIT/data/train/wit_v1.train.all-00008-of-00010.tsv.gz 2.49 GB
  • WIT/data/train/wit_v1.train.all-00009-of-00010.tsv.gz 2.49 GB
  • WIT/data/val/wit_v1.val.all-00000-of-00005.tsv.gz 38.46 MB
  • WIT/data/val/wit_v1.val.all-00001-of-00005.tsv.gz 38.24 MB
  • WIT/data/val/wit_v1.val.all-00002-of-00005.tsv.gz 37.81 MB
  • WIT/data/val/wit_v1.val.all-00003-of-00005.tsv.gz 38.11 MB
  • WIT/data/val/wit_v1.val.all-00004-of-00005.tsv.gz 38.09 MB