HyperAI초신경

MMID 이미지 분류 데이터 세트

날짜

2년 전

크기

9.44 GB

기관

펜실베이니아 대학교

MMID 데이터 세트는 펜실베이니아 대학에서 공개한 대규모 다국어 이미지 데이터 세트입니다. 데이터 세트는 이중으로 병렬화되어 있습니다. 각 언어의 단어는 단어를 나타내는 이미지와 병렬로 저장되고, 단어를 영어로 번역한 내용(및 해당 이미지)과 병렬로 저장됩니다. 현재 이 데이터 세트는 98개 언어로 제공되며, 각 언어당 최대 10,000개의 단어가 있습니다. 이 다운로드는 중국어 버전만 제공합니다. 자세한 내용은 다음을 방문하세요.http://multilingual-images.org/

MMID.torrent
시딩 2다운로드 중 0완료됨 1,016총 다운로드 횟수 1,048
  • MMID/
    • README.md
      1.06 KB
    • README.txt
      2.12 KB
      • data/
        • chinese-text-warcs.tgz
          3.13 GB
        • index-chinese-package.tsv
          3.13 GB
        • metadata-chinese-package.jsonl
          3.22 GB
        • mini-chinese-package.tgz
          3.36 GB
        • scale-chinese-package.tgz
          9.44 GB