HyperAIHyperAI

Command Palette

Search for a command to run...

MM-RLHF-Datensatz Zur Multimodalen Präferenzausrichtung

Date

vor einem Jahr

Size

55.33 GB

Organization

Paper URL

arxiv.org

License

Apache 2.0

MM-RLHF (Multimodal Reinforcement Learning from Human Feedback) ist ein hochwertiger, feinkörniger multimodaler Datensatz.MM-RLHF: Der nächste Schritt in der multimodalen LLM-Ausrichtung", erstmals veröffentlicht auf arXiv im Jahr 2025 vom Institute of Automation, Chinese Academy of Sciences (CASIA). Dieser Datensatz zielt darauf ab, die Ausrichtungsforschung multimodaler großer Sprachmodelle (MLLMs) voranzutreiben und die Fragen der Wahrhaftigkeit, Sicherheit und Ausrichtung des Modells an menschlichen Vorlieben in praktischen Anwendungen zu behandeln.

Der Datensatz enthält 120.000 Paare feinkörniger, manuell annotierter Präferenzvergleichsdaten, die drei Bereiche abdecken: Bildverständnis, Videoanalyse und multimodale Sicherheit. Die Datenmenge übersteigt die vorhandenen Ressourcen bei weitem und umfasst mehr als 100.000 multimodale Aufgabeninstanzen. Jedes Datenelement wurde von mehr als 50 Kommentatoren sorgfältig bewertet und interpretiert, um die hohe Qualität und Granularität der Daten sicherzustellen.

Dataset-Beispiel

MM-RLHF.torrent
Seeding 1Downloading 0Completed 156Total Downloads 186
  • MM-RLHF/
    • README.md
      1.55 KB
    • README.txt
      3.09 KB
      • data/
        • MM-RLHF.zip
          55.33 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp