HyperAIHyperAI

Command Palette

Search for a command to run...

CapsFusion-120M Multimodaler Bild- Und Textdatensatz

Date

vor 2 Jahren

Size

23.21 GB

Organization

Tsinghua-Universität

Publish URL

github.com

Paper URL

arxiv.org

Featured Image

Dieser Datensatz ist ein multimodaler Bild- und Textdatensatz, der 2024 von der Tsinghua-Universität und BAAI veröffentlicht wurde. Ergebnisse des Papiers „CapsFusion: Bild-Text-Daten im großen Maßstab neu denken“Es wurde von CVPR 2024 angenommen.

Dieser Datensatz ist eine hochwertige Ressource, die für ein groß angelegtes multimodales Vortraining verwendet werden kann. Diese Veröffentlichung enthält entsprechende Bildunterschriften aus den Datensätzen LAION-2B und LAION-COCO und erleichtert so vergleichende Analysen und weitere eingehende Studien zur Qualität der Bild-Text-Daten.

Jeder Dateneintrag besteht aus vier Feldern:

  • Bild-URL
  • LAION-2B Titel (ursprünglicher Alternativtext aus dem Internet)
  • LAION-COCO-Untertitel (synthetisiert von BLIP)
  • CapsFusion-Titel (Forschungsteam)
CapsFusion-120M.torrent
Seeding 1Downloading 0Completed 164Total Downloads 322
  • CapsFusion-120M/
    • README.md
      1.34 KB
    • README.txt
      2.69 KB
      • data/
        • CapsFusion-120M.zip
          23.21 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
CapsFusion-120M Multimodaler Bild- Und Textdatensatz | Datasets | HyperAI