WIT-Bild-Text-Datensatz
Datum
vor 3 Jahren
Größe
25.2 GB
Veröffentlichungs-URL
Lizenz
其他
Kategorien

WIT steht für Wikipedia-based Image Text, einen großen multimodalen und mehrsprachigen Datensatz. Der Datensatz besteht aus einer kuratierten Sammlung von 37,6 Millionen mit Entitäten angereicherten Bild-Text-Beispielen, die 11,5 Millionen einzigartige Bilder in 108 Wikipedia-Sprachen enthalten. Aufgrund seiner Größe eignet sich dieser Datensatz zur Verwendung als Vortrainingsdatensatz für multimodale Modelle des maschinellen Lernens.
WIT bietet vier einzigartige Vorteile:
- WIT ist der größte multimodale Datensatz im Hinblick auf die Anzahl der Bild-Text-Beispiele.
- Es werden über 100 Sprachen abgedeckt (mit mindestens 12.000 Beispielen pro Sprache) und für viele Bilder wird ein sprachübergreifender Text bereitgestellt.
- Im Vergleich zu früheren Datensätzen stellt WIT einen vielfältigeren Satz von Konzepten und realen Entitäten dar.
- WIT bietet einen sehr anspruchsvollen Testsatz für die reale Welt.
WIT.torrent
Seeding 0Herunterladen 3Abgeschlossen 382Gesamtdownloads 560