HLE-Datensatz Multidisziplinärer Wissensdatensatz
Datum
vor 4 Monaten
Veröffentlichungs-URL
Kategorien
HLE steht für Humanity’s Last Exam (dt.: „Die letzte Prüfung der Menschheit“). Es handelt sich um einen multimodalen Benchmark, der das neueste Wissen in einer breiten Palette von Disziplinen abdecken soll. Es wurde 2025 vom Center for AI Safety and Scale AI veröffentlicht. Die zugehörigen Ergebnisse des Papiers sind „Die letzte Prüfung der Menschheit". Der Datensatz wurde von Experten aus verschiedenen Disziplinen auf der ganzen Welt entwickelt und enthält 3.000 Fragen aus Dutzenden von Disziplinen, darunter Multiple-Choice- und Kurzantwortfragen aus Mathematik, Geisteswissenschaften und Naturwissenschaften, die für die automatische Bewertung geeignet sind.
