HyperAIHyperAI

Command Palette

Search for a command to run...

CL-bench Kontextlern-Evaluierungsbenchmark

Auf Discord diskutieren

Datum

vor 5 Stunden

Organisation

Fudan-Universität

Paper-URL

2602.03587

Lizenz

Other

CL-bench ist ein Benchmark-Datensatz zur Evaluierung der Kontextlernfähigkeiten eines großen Sprachmodells. Er wurde 2026 vom Hunyuan-Team von Tencent in Zusammenarbeit mit der Fudan-Universität veröffentlicht. Die zugehörigen Forschungsarbeiten sind folgende: CL-bench: Ein Benchmark für KontextlernenZiel ist es zu testen, ob ein Modell neue Regeln, Konzepte oder Domänenwissen aus einem gegebenen Kontext lernen kann, ohne auf vortrainiertes Wissen zurückzugreifen, und diese auf nachfolgende Aufgaben anwenden kann.

Dieser Datensatz umfasst 500 komplexe Kontextszenarien mit 1.899 spezifischen Aufgaben und bietet 31.607 detaillierte Bewertungsraster. Jede Aufgabe ist als mehrstufiger Dialog gestaltet und deckt verschiedene Kontextlernszenarien ab, wie z. B. Regelschlussfolgerung, Wissenserwerb und das Verständnis komplexer Anweisungen. Ziel ist die Bewertung der Fähigkeit des Modells, neue Informationen im Kontext zu verstehen, zusammenzufassen und anzuwenden.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp