Ensemble De Données De Préférences De Raisonnement Multimodal MMPR
Date
Taille
URL de publication
Catégories
MMPR (Multimodal Preference Dataset) est un ensemble de données de préférences multimodales à grande échelle publié conjointement en 2024 par les équipes de recherche du Shanghai Artificial Intelligence Laboratory, de l'Université Fudan, de l'Université de Nanjing, de l'Université chinoise de Hong Kong, de l'Université Tsinghua et de SenseTime. Les résultats de l'article connexe sont «Améliorer la capacité de raisonnement des grands modèles linguistiques multimodaux via l'optimisation des préférences mixtesL'ensemble de données contient 750 000 échantillons sans réponses claires et correctes et 2,5 millions d'échantillons avec des réponses claires et correctes. Les échantillons couvrent plusieurs domaines tels que l'AQV, les sciences, le graphisme, les mathématiques, l'OCR et les documents afin de garantir la diversité. Lors de la construction de l'ensemble de données, les chercheurs ont veillé à éviter les réponses faussement positives et négatives en raison des limites des règles heuristiques, notamment dans les domaines généraux de l'AQV et des documents. L'ensemble de données est conçu pour améliorer les performances du modèle dans les tâches de raisonnement multimodal tout en évitant les effets négatifs potentiels pendant l'apprentissage.
