HyperAI

MMID-Bildklassifizierungsdatensatz

Datum

vor 2 Jahren

Größe

9.44 GB

Organisation

Universität von Pennsylvania

Veröffentlichungs-URL

multilingual-images.org

Der MMID-Datensatz wird von der University of Pennsylvania veröffentlicht und ist ein umfangreicher mehrsprachiger Bilddatensatz. Und der Datensatz ist doppelt parallel: Für jede Sprache werden Wörter parallel mit Bildern gespeichert, die die Wörter darstellen, und parallel mit den Übersetzungen der Wörter ins Englische (und den entsprechenden Bildern). Derzeit ist der Datensatz in 98 Sprachen verfügbar, mit maximal 10.000 Wörtern in jeder Sprache. Dieser Download bietet nur die chinesische Version. Weitere Einzelheiten finden Sie unter:http://multilingual-images.org/

MMID.torrent
Seeding 2Herunterladen 0Abgeschlossen 1,016Gesamtdownloads 1,048
  • MMID/
    • README.md
      1.06 KB
    • README.txt
      2.12 KB
      • data/
        • chinese-text-warcs.tgz
          3.13 GB
        • index-chinese-package.tsv
          3.13 GB
        • metadata-chinese-package.jsonl
          3.22 GB
        • mini-chinese-package.tgz
          3.36 GB
        • scale-chinese-package.tgz
          9.44 GB