MMID 图像分类数据集

日期

1 年前

大小

9.44 GB

机构

University of Pennsylvania

MMID 数据集是由宾夕法尼亚大学发布,是一个大规模多语言的图像数据集。并且数据集是双重平行的:对于每种语言,单词与表示单词的图像平行存储,并与单词翻译成英语(和相应的图像)平行。目前该数据集有 98 种语言,每种语言最多 10,000 个单词,此次下载仅提供中文版,详情可浏览:http://multilingual-images.org/

MMID.torrent

做种 1

下载中 1

已完成 793

总下载 978

  • MMID/
    • README.md
      1.06 KB
    • README.txt
      2.12 KB
      • data/
        • chinese-text-warcs.tgz
          3.13 GB
        • index-chinese-package.tsv
          3.13 GB
        • metadata-chinese-package.jsonl
          3.22 GB
        • mini-chinese-package.tgz
          3.36 GB
        • scale-chinese-package.tgz
          9.44 GB