HyperAIHyperAI

Command Palette

Search for a command to run...

MM-RLHF-Datensatz Zur Multimodalen Präferenzausrichtung

Datum

vor 9 Monaten

Größe

55.33 GB

Organisation

Veröffentlichungs-URL

mm-rlhf.github.io

Paper-URL

arxiv.org

Lizenz

Apache 2.0

MM-RLHF (Multimodal Reinforcement Learning from Human Feedback) ist ein hochwertiger, feinkörniger multimodaler Datensatz.MM-RLHF: Der nächste Schritt in der multimodalen LLM-Ausrichtung", erstmals veröffentlicht auf arXiv im Jahr 2025 vom Institute of Automation, Chinese Academy of Sciences (CASIA). Dieser Datensatz zielt darauf ab, die Ausrichtungsforschung multimodaler großer Sprachmodelle (MLLMs) voranzutreiben und die Fragen der Wahrhaftigkeit, Sicherheit und Ausrichtung des Modells an menschlichen Vorlieben in praktischen Anwendungen zu behandeln.

Der Datensatz enthält 120.000 Paare feinkörniger, manuell annotierter Präferenzvergleichsdaten, die drei Bereiche abdecken: Bildverständnis, Videoanalyse und multimodale Sicherheit. Die Datenmenge übersteigt die vorhandenen Ressourcen bei weitem und umfasst mehr als 100.000 multimodale Aufgabeninstanzen. Jedes Datenelement wurde von mehr als 50 Kommentatoren sorgfältig bewertet und interpretiert, um die hohe Qualität und Granularität der Daten sicherzustellen.

Dataset-Beispiel

MM-RLHF.torrent
Seeding 1Herunterladen 0Abgeschlossen 147Gesamtdownloads 168
  • MM-RLHF/
    • README.md
      1.55 KB
    • README.txt
      3.09 KB
      • data/
        • MM-RLHF.zip
          55.33 GB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
MM-RLHF-Datensatz Zur Multimodalen Präferenzausrichtung | Datensätze | HyperAI