HyperAI

Ensemble De Données RLAIF-V Ensemble De Données De Préférences Multimodales À Grande Échelle

Date

il y a un an

Taille

11.77 GB

Organisation

OpenBMB

URL de publication

huggingface.co

L'ensemble de données RLAIF-V est un ensemble de données de préférences multimodales généré par l'IA qui couvre une variété de tâches et de domaines. L'ensemble de données contient plus de 44 757 paires de haute qualité pour la formation et l'évaluation de modèles linguistiques multimodaux de grande taille (MLLM). L'ensemble de données RLAIF-V utilise une nouvelle approche pour déconfondre les réponses du modèle à l'aide d'un grand modèle open source et fournit des données de rétroaction de haute qualité pour réduire le phénomène d'hallucination de différents MLLM.

De plus, l'ensemble de données RLAIF-V est également utilisé pour former le modèle MiniCPM-Llama3-V 2.5, qui représente le premier MLLM17 de niveau GPT-4V de bout en bout. Le projet RLAIF-V a ouvert le code, les poids (7B, 12B) et les données pour une utilisation et des recherches plus poussées par la communauté de recherche.

Les principales caractéristiques de l'ensemble de données RLAIF-V comprennent :

  1. Données de rétroaction de haute qualité:Réduction efficace des hallucinations par différents MLLM utilisés dans l'ensemble de données.
  2. Open Source:L'ensemble de données est entièrement open source, ce qui permet aux chercheurs d'y accéder et de l'utiliser librement.
  3. Multi-tâches et multi-domaines:L'ensemble de données couvre un large éventail de tâches et de domaines, fournissant des données de préférences diverses.

La licence de l'ensemble de données RLAIF-V est CC BY NC 4.0, ce qui autorise uniquement une utilisation non commerciale, et les modèles formés à l'aide de cet ensemble de données ne doivent pas être utilisés en dehors des fins de recherche.

RLAIF-V-Dataset.torrent
Partage 1Téléchargement 1Terminés 77Téléchargements totaux 88
  • RLAIF-V-Dataset/
    • README.md
      1.86 KB
    • README.txt
      3.72 KB
      • data/
        • RLAIF-V-Dataset.zip
          11.77 GB