Command Palette
Search for a command to run...
SuperGPQA-Benchmark-Datensatz Zur Fachbereichsbewertung
SuperGPQA ist ein Benchmark-Datensatz zur Bewertung der Leistung fortschrittlicher Frage-Antwort-Systeme. Es wurde 2025 vom Multimodal Art Projection-Team entwickelt. Die zugehörigen Papierergebnisse sind "SuperGPQA: Skalierung der LLM-Bewertung in 285 Graduiertendisziplinen". Dieser Datensatz konzentriert sich auf den Bereich der Verarbeitung natürlicher Sprache und der Bewertung maschinellen Lernens und zielt darauf ab, die Argumentationsfähigkeit und den Wissensstand des Modells anhand komplexer interdisziplinärer Probleme zu testen.
Der Datensatz umfasst 285 Themenbereiche auf Hochschulniveau mit unterschiedlichen Fragetypen, darunter Biologie, Physik, Chemie und andere wissenschaftliche Bereiche.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.