HyperAIHyperAI

Command Palette

Search for a command to run...

SuperGPQA-Benchmark-Datensatz Zur Fachbereichsbewertung

Datum

vor 8 Monaten

Organisation

Paper-URL

arxiv.org

Lizenz

Apache 2.0

Treten Sie der Discord-Community bei

SuperGPQA ist ein Benchmark-Datensatz zur Bewertung der Leistung fortschrittlicher Frage-Antwort-Systeme. Es wurde 2025 vom Multimodal Art Projection-Team entwickelt. Die zugehörigen Papierergebnisse sind "SuperGPQA: Skalierung der LLM-Bewertung in 285 Graduiertendisziplinen". Dieser Datensatz konzentriert sich auf den Bereich der Verarbeitung natürlicher Sprache und der Bewertung maschinellen Lernens und zielt darauf ab, die Argumentationsfähigkeit und den Wissensstand des Modells anhand komplexer interdisziplinärer Probleme zu testen.

Der Datensatz umfasst 285 Themenbereiche auf Hochschulniveau mit unterschiedlichen Fragetypen, darunter Biologie, Physik, Chemie und andere wissenschaftliche Bereiche.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
SuperGPQA-Benchmark-Datensatz Zur Fachbereichsbewertung | Datensätze | HyperAI