Command Palette
Search for a command to run...
Ensemble De Données image-texte WIT
Date
il y a 3 ans
Taille
25.2 GB
URL de publication
URL de l'article
Licence
Autre

WIT signifie Wikipedia-based Image Text, qui est un vaste ensemble de données multimodales et multilingues. L'ensemble de données se compose d'une collection organisée de 37,6 millions d'exemples d'images-textes enrichis en entités, contenant 11,5 millions d'images uniques dans 108 langues de Wikipédia. La taille de cet ensemble de données le rend adapté à une utilisation comme ensemble de données de pré-formation pour les modèles d'apprentissage automatique multimodaux.
WIT présente quatre avantages uniques :
- WIT est le plus grand ensemble de données multimodales en termes de nombre d'exemples d'images et de textes.
- Plus de 100 langues sont couvertes (avec au moins 12 000 exemples par langue) et un texte multilingue est fourni pour de nombreuses images.
- Par rapport aux ensembles de données précédents, WIT représente un ensemble plus diversifié de concepts et d’entités du monde réel.
- WIT fournit un ensemble de tests du monde réel très stimulant.
WIT.torrent
Partage 1Téléchargement 1Terminés 570Téléchargements totaux 736
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.
Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Hyper Newsletters
Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp