Command Palette
Search for a command to run...
Ensemble De Données De Référence APEX AI Pour La Productivité
Date
Publish URL
Paper URL
APEX est un ensemble de données de référence complet, initialement publié en 2025 par l'équipe de recherche Mercor en collaboration avec la faculté de droit de Harvard et le Scripps Research Institute. Il sert à évaluer les performances des modèles d'intelligence artificielle de pointe dans les tâches intellectuelles à forte valeur ajoutée. L'article de recherche associé s'intitule « ... ».L'indice de productivité de l'IA (APEX)L’objectif est de mesurer les performances des modèles d’IA de pointe dans des tâches économiques réelles, plutôt que de se concentrer uniquement sur le raisonnement abstrait.
La version actuelle de cet ensemble de données est APEX-v1.0. Elle comprend 200 cas de tâches professionnelles à forte valeur économique, couvrant quatre domaines typiques à forte intensité de connaissances : la banque d’investissement, le conseil en management, le droit et les soins de santé de base. Chaque tâche correspond au travail d’analyse, de jugement et de documentation qui nécessiterait entre 1 et 8 heures de travail pour un professionnel. Elle est accompagnée de preuves citées et de critères d’évaluation précis et interprétables permettant de mesurer objectivement la qualité des résultats du modèle.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.