HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Référence APEX AI Pour La Productivité

Date

il y a 2 mois

Organization

Faculté de droit de Harvard
Mercor
L'Institut de recherche Scripps

Publish URL

www.mercor.com

Paper URL

2509.25721

APEX est un ensemble de données de référence complet, initialement publié en 2025 par l'équipe de recherche Mercor en collaboration avec la faculté de droit de Harvard et le Scripps Research Institute. Il sert à évaluer les performances des modèles d'intelligence artificielle de pointe dans les tâches intellectuelles à forte valeur ajoutée. L'article de recherche associé s'intitule « ... ».L'indice de productivité de l'IA (APEX)L’objectif est de mesurer les performances des modèles d’IA de pointe dans des tâches économiques réelles, plutôt que de se concentrer uniquement sur le raisonnement abstrait.

La version actuelle de cet ensemble de données est APEX-v1.0. Elle comprend 200 cas de tâches professionnelles à forte valeur économique, couvrant quatre domaines typiques à forte intensité de connaissances : la banque d’investissement, le conseil en management, le droit et les soins de santé de base. Chaque tâche correspond au travail d’analyse, de jugement et de documentation qui nécessiterait entre 1 et 8 heures de travail pour un professionnel. Elle est accompagnée de preuves citées et de critères d’évaluation précis et interprétables permettant de mesurer objectivement la qualité des résultats du modèle.

Processus de construction du jeu de données

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp