HyperAIHyperAI

Command Palette

Search for a command to run...

Llama Nemotron VLM v1 Multimodaler Bild- Und Textdatensatz

Datum

vor 2 Monaten

Größe

98.09 GB

Organisation

NVIDIA

Lizenz

CC BY 4.0

Llama Nemotron VLM v1 ist ein hochwertiger Bild- und Textdatensatz, der 2025 von NVIDIA für das VLM-Nachtraining veröffentlicht wurde. Er wird zur Unterstützung des von NVIDIA veröffentlichten Dokumentverständnismodells Llama-3.1-Nemotron-Nano-VL-8B-V1 verwendet (unterstützt die Beantwortung von Dokumentfragen, die Beantwortung von Graphfragen, AI2D und andere Szenarien).

Der Datensatz besteht aus 21 Teilmengen mit insgesamt 2.863.854 Beispielen. Er deckt drei Kategorien ab: visuelle Frage- und Antwortfunktion (VQA), Bildunterschriften und optische Zeichenerkennung (OCR). Er enthält neu annotierte öffentliche Bilddatensätze, vollständig und teilweise synthetisierte OCR-Daten (auf Chinesisch und Englisch, auf Zeichen-, Wort- und Seitenebene) sowie intern annotierte OCR-Sätze. Der Datensatz verfeinert und verbessert zudem die ursprüngliche Frage- und Antwortfunktion bzw. die Bildunterschriften und eignet sich daher für das multimodale Training und die Evaluierung von Anwendungen wie intelligenten Agenten, Chat-Assistenten und RAGs.

Die Daten umfassen:

  • VQA (Visual Question Answering): 1.917.755 Beispiele
  • Untertitelung: 131.718 Beispiele
  • OCR (Texterkennung): 814.381 Beispiele
Llama-Nemotron-VLM-Dataset-v1.torrent
Seeding 1Herunterladen 0Abgeschlossen 12Gesamtdownloads 42
  • Llama-Nemotron-VLM-Dataset-v1/
    • README.md
      1.65 KB
    • README.txt
      3.3 KB
      • data/
        • Llama-Nemotron-VLM-Dataset-v1.zip
          98.09 GB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp