HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données image-texte WIT

Date

il y a 3 ans

Size

25.2 GB

Organization

Google

Publish URL

github.com

Paper URL

arxiv.org

License

Other

Featured Image

WIT signifie Wikipedia-based Image Text, qui est un vaste ensemble de données multimodales et multilingues. L'ensemble de données se compose d'une collection organisée de 37,6 millions d'exemples d'images-textes enrichis en entités, contenant 11,5 millions d'images uniques dans 108 langues de Wikipédia. La taille de cet ensemble de données le rend adapté à une utilisation comme ensemble de données de pré-formation pour les modèles d'apprentissage automatique multimodaux.

WIT présente quatre avantages uniques :

  • WIT est le plus grand ensemble de données multimodales en termes de nombre d'exemples d'images et de textes.
  • Plus de 100 langues sont couvertes (avec au moins 12 000 exemples par langue) et un texte multilingue est fourni pour de nombreuses images.
  • Par rapport aux ensembles de données précédents, WIT représente un ensemble plus diversifié de concepts et d’entités du monde réel.
  • WIT fournit un ensemble de tests du monde réel très stimulant.
WIT.torrent
Seeding 1Downloading 1Completed 585Total Downloads 769
  • WIT/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
          • test/
            • wit_v1.test.all-00000-of-00005.tsv.gz
              30.8 MB
            • wit_v1.test.all-00001-of-00005.tsv.gz
              61.46 MB
            • wit_v1.test.all-00002-of-00005.tsv.gz
              91.95 MB
            • wit_v1.test.all-00003-of-00005.tsv.gz
              122.5 MB
            • wit_v1.test.all-00004-of-00005.tsv.gz
              153.14 MB
          • train/
            • wit_v1.train.all-00000-of-00010.tsv.gz
              2.64 GB
            • wit_v1.train.all-00001-of-00010.tsv.gz
              5.12 GB
            • wit_v1.train.all-00002-of-00010.tsv.gz
              7.61 GB
            • wit_v1.train.all-00003-of-00010.tsv.gz
              10.1 GB
            • wit_v1.train.all-00004-of-00010.tsv.gz
              12.58 GB
            • wit_v1.train.all-00005-of-00010.tsv.gz
              15.07 GB
            • wit_v1.train.all-00006-of-00010.tsv.gz
              17.56 GB
            • wit_v1.train.all-00007-of-00010.tsv.gz
              20.04 GB
            • wit_v1.train.all-00008-of-00010.tsv.gz
              22.53 GB
            • wit_v1.train.all-00009-of-00010.tsv.gz
              25.02 GB
          • val/
            • wit_v1.val.all-00000-of-00005.tsv.gz
              25.05 GB
            • wit_v1.val.all-00001-of-00005.tsv.gz
              25.09 GB
            • wit_v1.val.all-00002-of-00005.tsv.gz
              25.13 GB
            • wit_v1.val.all-00003-of-00005.tsv.gz
              25.17 GB
            • wit_v1.val.all-00004-of-00005.tsv.gz
              25.2 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp