SubLlME Est Une Méthode De Sélection De sous-ensembles Efficace En Termes De Données, Basée Sur La Prédiction De Corrélation De classement.
La sélection de sous-ensembles via la prédiction de corrélation de rang pour une évaluation LLM efficace en termes de données (SubLlME) est une nouvelle méthode d'évaluation proposée par HP Labs et d'autres équipes en juillet 2025. Elle vise à obtenir une évaluation efficace et précise des performances du modèle grâce à la prédiction de corrélation de rang sans nécessiter d'évaluation complète.SubLIME : Sélection de sous-ensembles par prédiction de corrélation de rang pour une évaluation efficace des données du LLM", qui a remporté le prix ACL 25 Best Theme Paper Award.
SubLIME s'appuie sur la stratégie d'évaluation de la Compétition Olympique de Mathématiques. En sélectionnant intelligemment un sous-ensemble restreint mais représentatif, il prédit la performance relative des modèles lors de l'évaluation complète, réduisant ainsi significativement le coût d'évaluation (réduction de 80% à 99%) tout en conservant des résultats de classement des modèles très cohérents.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.