MMID画像分類データセット

MMID データセットは、ペンシルベニア大学によってリリースされ、大規模な多言語画像データセットです。そして、データセットは二重並列です。言語ごとに、単語は単語を表す画像と並行して保存され、単語の英語への翻訳 (および対応する画像) と並行して保存されます。現在、データ セットは 98 言語で利用でき、各言語には最大 10,000 語が含まれています。詳細については、次のサイトをご覧ください。http://multilingual-images.org/

MMID.torrent

做种 1

下载中 1

已完成 841

总下载 994

  • MMID/
    • README.md
      1.06 KB
    • README.txt
      2.12 KB
      • data/
        • chinese-text-warcs.tgz
          3.13 GB
        • index-chinese-package.tsv
          3.13 GB
        • metadata-chinese-package.jsonl
          3.22 GB
        • mini-chinese-package.tgz
          3.36 GB
        • scale-chinese-package.tgz
          9.44 GB