HyperAIHyperAI

Command Palette

Search for a command to run...

RLAIF-V-Datensatz Umfangreicher Multimodaler Präferenzdatensatz

Datum

vor 2 Jahren

Größe

11.77 GB

Organisation

OpenBMB

Paper-URL

arxiv.org

Der RLAIF-V-Datensatz ist ein KI-generierter multimodaler Präferenzdatensatz, der eine Vielzahl von Aufgaben und Domänen abdeckt. Der Datensatz enthält über 44.757 hochwertige Paare zum Trainieren und Bewerten multimodaler großer Sprachmodelle (MLLMs). Der RLAIF-V-Datensatz verwendet einen neuartigen Ansatz zur Dekonfundierung von Modellreaktionen mithilfe eines großen Open-Source-Modells und bietet qualitativ hochwertige Feedback-Daten zur Reduzierung des Halluzinationsphänomens verschiedener MLLMs.

Darüber hinaus wird der RLAIF-V-Datensatz auch zum Trainieren des MiniCPM-Llama3-V 2.5-Modells verwendet, das das erste End-to-End-MLLM17 auf GPT-4V-Ebene darstellt. Das RLAIF-V-Projekt hat den Code, die Gewichte (7B, 12B) und die Daten zur Verwendung und weiteren Erforschung durch die Forschungsgemeinschaft als Open Source bereitgestellt.

Zu den Hauptmerkmalen des RLAIF-V-Datensatzes gehören:

  1. Hochwertige Feedback-Daten: Effektive Reduzierung von Halluzinationen durch verschiedene im Datensatz verwendete MLLMs.
  2. Open Source: Der Datensatz ist vollständig Open Source, sodass Forscher frei darauf zugreifen und ihn verwenden können.
  3. Multitasking und Multidomänen: Der Datensatz deckt ein breites Spektrum an Aufgaben und Domänen ab und bietet vielfältige Präferenzdaten.

Die Lizenz des RLAIF-V-Datensatzes lautet CC BY NC 4.0, was nur eine nichtkommerzielle Nutzung erlaubt. Mit diesem Datensatz trainierte Modelle sollten nicht außerhalb von Forschungszwecken verwendet werden.

RLAIF-V-Dataset.torrent
Seeding 1Wird heruntergeladen 0Abgeschlossen 175Gesamtdownloads 243
  • RLAIF-V-Dataset/
    • README.md
      1.86 KB
    • README.txt
      3.72 KB
      • data/
        • RLAIF-V-Dataset.zip
          11.77 GB

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp