HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données d'alignement Des Préférences Multimodales MM-RLHF

Date

il y a 9 mois

Taille

55.33 GB

Organisation

URL de publication

mm-rlhf.github.io

URL de l'article

arxiv.org

Licence

Apache 2.0

MM-RLHF (Multimodal Reinforcement Learning from Human Feedback) est un ensemble de données multimodales de haute qualité et à granularité fine.MM-RLHF : la prochaine étape vers l'alignement multimodal des LLM", publié pour la première fois sur arXiv en 2025 par l'Institut d'automatisation de l'Académie chinoise des sciences (CASIA). Cet ensemble de données vise à promouvoir la recherche sur l'alignement des modèles multimodaux de langage à grande échelle (MLLM) et à aborder les questions de véracité, de sécurité et d'alignement du modèle avec les préférences humaines dans les applications pratiques.

L'ensemble de données contient 120 000 paires de données de comparaison de préférences à granularité fine et annotées manuellement, couvrant trois domaines : la compréhension des images, l'analyse vidéo et la sécurité multimodale. La quantité de données dépasse de loin les ressources existantes, couvrant plus de 100 000 instances de tâches multimodales. Chaque élément de données a été soigneusement noté et interprété par plus de 50 annotateurs, garantissant la haute qualité et la granularité des données.

Exemple d'ensemble de données

MM-RLHF.torrent
Partage 1Téléchargement 0Terminés 147Téléchargements totaux 168
  • MM-RLHF/
    • README.md
      1.55 KB
    • README.txt
      3.09 KB
      • data/
        • MM-RLHF.zip
          55.33 GB

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Ensemble De Données d'alignement Des Préférences Multimodales MM-RLHF | Ensembles de données | HyperAI