Datum

vor 6 Monaten

Lizenz

Apache 2.0

Tags

LongBench-Pro ist ein 2025 veröffentlichter Datensatz zur Evaluierung von Sprachmodellen für lange Kontexte. Ziel ist die systematische Bewertung der Fähigkeit des Modells, lange Texte unter verschiedenen Kontextlängen, Aufgabentypen und Betriebsbedingungen zu verstehen und zu verarbeiten. Dieser Datensatz umfasst 1.500 Beispiele, darunter 11 Aufgaben der Stufe 1 und 25 Aufgaben der Stufe 2. Die Aufgaben sind anhand ihrer Kontextnutzung in Vollkontext- und Teilkontextaufgaben unterteilt. Er enthält sowohl englische als auch chinesische Beispiele mit einer ausgewogenen Verteilung beider Sprachen. Der Schwierigkeitsgrad der Aufgaben ist in vier Stufen eingeteilt: Leicht, Mittel, Schwer und Extrem. Hinsichtlich der Kontextlänge decken die Beispiele sechs Längenbereiche von 8.000 bis 256.000 Token ab und sind gleichmäßig verteilt.

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

Datum

vor 6 Monaten

Lizenz

Apache 2.0

Zugehörige Datensätze

Sutra 10B Vortrainings- Und Trainingsdatensatz

vor 2 Monaten

Klinischer Datensatz Zu Lungenkrebs

vor 2 Monaten

CL-bench Context Learning Evaluation Benchmark-Datensatz

vor 4 Monaten

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor 5 Monaten

MCIF Multimodal Cross-Language Instruction Following Dataset

vor 5 Monaten

TxT360-3efforts Multi-Task Inference Dataset

vor 5 Monaten

Datensatz Zur Röntgen-Schmuggelware-Erkennung

vor 5 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

LongBench-Pro Long Context Comprehensive Evaluation Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

LongBench-Pro Long Context Comprehensive Evaluation Dataset

Zugehörige Datensätze

Sutra 10B Vortrainings- Und Trainingsdatensatz

Klinischer Datensatz Zu Lungenkrebs

CL-bench Context Learning Evaluation Benchmark-Datensatz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

Datensatz Zur Röntgen-Schmuggelware-Erkennung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

LongBench-Pro Long Context Comprehensive Evaluation Dataset

Zugehörige Datensätze

Sutra 10B Vortrainings- Und Trainingsdatensatz

Klinischer Datensatz Zu Lungenkrebs

CL-bench Context Learning Evaluation Benchmark-Datensatz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

Datensatz Zur Röntgen-Schmuggelware-Erkennung

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

Sutra 10B Vortrainings- Und Trainingsdatensatz

Klinischer Datensatz Zu Lungenkrebs

CL-bench Context Learning Evaluation Benchmark-Datensatz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

Datensatz Zur Röntgen-Schmuggelware-Erkennung

Zugehörige Datensätze

Sutra 10B Vortrainings- Und Trainingsdatensatz

Klinischer Datensatz Zu Lungenkrebs

CL-bench Context Learning Evaluation Benchmark-Datensatz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

Datensatz Zur Röntgen-Schmuggelware-Erkennung