Cadre De Sélection De Données De Pré-formation Multidimensionnelles Méta-évaluateur
Une méthode de sélection de données multidimensionnelle pour les modèles linguistiques de pré-formation (méta-évaluateur) a été proposée par le Shanghai Artificial Intelligence Laboratory et l'East China Normal University le 4 juin 2025. Elle vise à intégrer les quatre dimensions du professionnalisme, de la lisibilité, du raisonnement et de la propreté avec les indicateurs de qualité existants en apprenant les poids optimaux.Méta-évaluateur : une méthode de sélection de données multidimensionnelle pour les modèles linguistiques de pré-formation", qui a remporté le prix ACL 25 Best Theme Paper Award.
Meta-rater utilise un modèle de substitution pour entraîner un modèle de régression et prédire la perte de l'ensemble de validation, identifiant ainsi la combinaison optimale de scores de qualité. Les résultats expérimentaux montrent que Meta-rater peut tripler la vitesse de convergence d'un modèle à 1,3 milliard de paramètres et améliorer les performances des tâches en aval de 3,23%. Cet avantage est extensible à un modèle à 7,2 milliards de paramètres.