Command Palette
Search for a command to run...
CL-bench Kontextlern-Evaluierungsbenchmark
CL-bench ist ein Benchmark-Datensatz zur Evaluierung der Kontextlernfähigkeiten eines großen Sprachmodells. Er wurde 2026 vom Hunyuan-Team von Tencent in Zusammenarbeit mit der Fudan-Universität veröffentlicht. Die zugehörigen Forschungsarbeiten sind folgende: CL-bench: Ein Benchmark für KontextlernenZiel ist es zu testen, ob ein Modell neue Regeln, Konzepte oder Domänenwissen aus einem gegebenen Kontext lernen kann, ohne auf vortrainiertes Wissen zurückzugreifen, und diese auf nachfolgende Aufgaben anwenden kann.
Dieser Datensatz umfasst 500 komplexe Kontextszenarien mit 1.899 spezifischen Aufgaben und bietet 31.607 detaillierte Bewertungsraster. Jede Aufgabe ist als mehrstufiger Dialog gestaltet und deckt verschiedene Kontextlernszenarien ab, wie z. B. Regelschlussfolgerung, Wissenserwerb und das Verständnis komplexer Anweisungen. Ziel ist die Bewertung der Fähigkeit des Modells, neue Informationen im Kontext zu verstehen, zusammenzufassen und anzuwenden.
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.