HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Référence APEX AI Pour La Productivité

Date

il y a 3 mois

Organisation

Faculté de droit de Harvard
Mercor
L'Institut de recherche Scripps

URL de publication

www.mercor.com

URL du document

2509.25721

APEX est un ensemble de données de référence complet, initialement publié en 2025 par l'équipe de recherche Mercor en collaboration avec la faculté de droit de Harvard et le Scripps Research Institute. Il sert à évaluer les performances des modèles d'intelligence artificielle de pointe dans les tâches intellectuelles à forte valeur ajoutée. L'article de recherche associé s'intitule « ... ».L'indice de productivité de l'IA (APEX)L’objectif est de mesurer les performances des modèles d’IA de pointe dans des tâches économiques réelles, plutôt que de se concentrer uniquement sur le raisonnement abstrait.

La version actuelle de cet ensemble de données est APEX-v1.0. Elle comprend 200 cas de tâches professionnelles à forte valeur économique, couvrant quatre domaines typiques à forte intensité de connaissances : la banque d’investissement, le conseil en management, le droit et les soins de santé de base. Chaque tâche correspond au travail d’analyse, de jugement et de documentation qui nécessiterait entre 1 et 8 heures de travail pour un professionnel. Elle est accompagnée de preuves citées et de critères d’évaluation précis et interprétables permettant de mesurer objectivement la qualité des résultats du modèle.

Processus de construction du jeu de données

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp