HyperAIHyperAI

Command Palette

Search for a command to run...

APEX AI Produktivitäts-Benchmark-Datensatz

Datum

vor 3 Tagen

Organisation

Harvard Law School
Mercor
Das Scripps-Forschungsinstitut

Veröffentlichungs-URL

www.mercor.com

Paper-URL

2509.25721

APEX ist ein umfassender Benchmark-Datensatz, der 2025 vom Mercor-Forschungsteam in Zusammenarbeit mit der Harvard Law School und dem Scripps Research Institute veröffentlicht wurde. Er dient der Bewertung der Leistungsfähigkeit modernster KI-Modelle bei wissensintensiven Aufgaben mit hohem wirtschaftlichem Wert. Die zugehörige Forschungsarbeit trägt den Titel „…“.Der KI-Produktivitätsindex (APEX)Ziel ist es, die Leistungsfähigkeit modernster KI-Modelle bei realen wirtschaftlichen Aufgaben zu messen, anstatt sich nur auf abstraktes Denken zu konzentrieren.

Die aktuelle Version dieses Datensatzes ist APEX-v1.0. Sie enthält 200 Aufgaben mit hohem wirtschaftlichem Wert, die professionelles Fachwissen aus vier typischen wissensintensiven Bereichen abdecken: Investmentbanking, Unternehmensberatung, Recht und Gesundheitswesen. Jede Aufgabe entspricht der Analyse-, Beurteilungs- und Dokumentationsarbeit, für die Fachkräfte in der Praxis 1–8 Stunden benötigen würden. Sie wird durch zitierfähige Belege und interpretierbare, detaillierte Bewertungskriterien ergänzt, um die Qualität der Modellergebnisse objektiv zu messen.

Prozess der Datensatzerstellung

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp