CapsFusion-120M Multimodaler Bild- Und Textdatensatz
Datum
vor einem Jahr
Größe
23.21 GB
Veröffentlichungs-URL
Kategorien

Dieser Datensatz ist ein multimodaler Bild- und Textdatensatz, der 2024 von der Tsinghua-Universität und BAAI veröffentlicht wurde. Ergebnisse des Papiers „CapsFusion: Bild-Text-Daten im großen Maßstab neu denken“Es wurde von CVPR 2024 angenommen.
Dieser Datensatz ist eine hochwertige Ressource, die für ein groß angelegtes multimodales Vortraining verwendet werden kann. Diese Veröffentlichung enthält entsprechende Bildunterschriften aus den Datensätzen LAION-2B und LAION-COCO und erleichtert so vergleichende Analysen und weitere eingehende Studien zur Qualität der Bild-Text-Daten.
Jeder Dateneintrag besteht aus vier Feldern:
- Bild-URL
- LAION-2B Titel (ursprünglicher Alternativtext aus dem Internet)
- LAION-COCO-Untertitel (synthetisiert von BLIP)
- CapsFusion-Titel (Forschungsteam)
CapsFusion-120M.torrent
Seeding 1Herunterladen 1Abgeschlossen 78Gesamtdownloads 148