Datum

vor 4 Monaten

Organisation

Paper-URL

2509.02473

Lizenz

CC BY 4.0

Datensatzstruktur

Der Datensatz enthält drei Aufgabentypen:

Single-Choice-Fragen: Es gibt 579 sorgfältig gestaltete Fragen mit jeweils nur einer richtigen Antwort. Sie werden hauptsächlich verwendet, um das Verständnis des Modells für Datenbankkonzepte und SQL-Abfragen zu testen.
Multiple-Choice-Fragen (Multiple): Insgesamt 760 komplexe Fragen mit mehreren möglichen richtigen Antworten. Sie enthalten präzise numerische Berechnungsergebnisse und Schlussfolgerungen auf der Grundlage von Schlussfolgerungen und dienen zur Bewertung der umfassenden Leistung des Modells bei der Datenanalyse und den Schlussfolgerungsfähigkeiten.
Berichterstellung (Bericht): Insgesamt 668 Fragen erfordern die Erstellung detaillierter Analyseberichte, testen die Fähigkeit des Datenagenten, umfassende Analysen in einer Umgebung mit mehreren Datenquellen durchzuführen und einen Standardbericht als vergleichenden Bewertungsmaßstab bereitzustellen.

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Verwandt Datensätze

SSRB-Datensatz Für Semistrukturierte Daten Und Abfragen in Natürlicher Sprache

vor 2 Monaten

DeepSearchQA Mehrstufiger Datensatz Zur Informationssuche Und Beantwortung Von Fragen

vor einem Monat

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

Datum

vor 4 Monaten

Organisation

Paper-URL

2509.02473

Lizenz

CC BY 4.0

Datensatzstruktur

Der Datensatz enthält drei Aufgabentypen:

Single-Choice-Fragen: Es gibt 579 sorgfältig gestaltete Fragen mit jeweils nur einer richtigen Antwort. Sie werden hauptsächlich verwendet, um das Verständnis des Modells für Datenbankkonzepte und SQL-Abfragen zu testen.
Multiple-Choice-Fragen (Multiple): Insgesamt 760 komplexe Fragen mit mehreren möglichen richtigen Antworten. Sie enthalten präzise numerische Berechnungsergebnisse und Schlussfolgerungen auf der Grundlage von Schlussfolgerungen und dienen zur Bewertung der umfassenden Leistung des Modells bei der Datenanalyse und den Schlussfolgerungsfähigkeiten.
Berichterstellung (Bericht): Insgesamt 668 Fragen erfordern die Erstellung detaillierter Analyseberichte, testen die Fähigkeit des Datenagenten, umfassende Analysen in einer Umgebung mit mehreren Datenquellen durchzuführen und einen Standardbericht als vergleichenden Bewertungsmaßstab bereitzustellen.

Verwandt Datensätze

SSRB-Datensatz Für Semistrukturierte Daten Und Abfragen in Natürlicher Sprache

vor 2 Monaten

DeepSearchQA Mehrstufiger Datensatz Zur Informationssuche Und Beantwortung Von Fragen

vor einem Monat

MCIF Multimodal Cross-Language Instruction Following Dataset

vor einem Monat

VenusBench-GD Plattformübergreifende Schnittstelle: Datensatz Verstehen

vor einem Monat

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor einem Monat

LongBench-Pro Long Context Comprehensive Evaluation Dataset

vor einem Monat

FirstAidQA Erste-Hilfe-Wissensfragen-Antworten-Datensatz

vor 2 Monaten

Spatial-SSRL-81k Spatial Awareness Self-Supervised Dataset

vor 2 Monaten

HumanSense Benchmark-Datensatz

vor 3 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

FDAbench – Vollständiger Benchmark-Datensatz Für Die Heterogene Datenanalyse

Datensatzstruktur

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

FDAbench – Vollständiger Benchmark-Datensatz Für Die Heterogene Datenanalyse

Datensatzstruktur

Verwandt Datensätze

SSRB-Datensatz Für Semistrukturierte Daten Und Abfragen in Natürlicher Sprache

DeepSearchQA Mehrstufiger Datensatz Zur Informationssuche Und Beantwortung Von Fragen

MCIF Multimodal Cross-Language Instruction Following Dataset

VenusBench-GD Plattformübergreifende Schnittstelle: Datensatz Verstehen

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

LongBench-Pro Long Context Comprehensive Evaluation Dataset

FirstAidQA Erste-Hilfe-Wissensfragen-Antworten-Datensatz

Spatial-SSRL-81k Spatial Awareness Self-Supervised Dataset

HumanSense Benchmark-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

FDAbench – Vollständiger Benchmark-Datensatz Für Die Heterogene Datenanalyse

Datensatzstruktur

Verwandt Datensätze

SSRB-Datensatz Für Semistrukturierte Daten Und Abfragen in Natürlicher Sprache

DeepSearchQA Mehrstufiger Datensatz Zur Informationssuche Und Beantwortung Von Fragen

MCIF Multimodal Cross-Language Instruction Following Dataset

VenusBench-GD Plattformübergreifende Schnittstelle: Datensatz Verstehen

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

LongBench-Pro Long Context Comprehensive Evaluation Dataset

FirstAidQA Erste-Hilfe-Wissensfragen-Antworten-Datensatz

Spatial-SSRL-81k Spatial Awareness Self-Supervised Dataset

HumanSense Benchmark-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Verwandt Datensätze

SSRB-Datensatz Für Semistrukturierte Daten Und Abfragen in Natürlicher Sprache

DeepSearchQA Mehrstufiger Datensatz Zur Informationssuche Und Beantwortung Von Fragen

MCIF Multimodal Cross-Language Instruction Following Dataset

VenusBench-GD Plattformübergreifende Schnittstelle: Datensatz Verstehen

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

LongBench-Pro Long Context Comprehensive Evaluation Dataset

FirstAidQA Erste-Hilfe-Wissensfragen-Antworten-Datensatz

Spatial-SSRL-81k Spatial Awareness Self-Supervised Dataset

HumanSense Benchmark-Datensatz

Verwandt Datensätze

SSRB-Datensatz Für Semistrukturierte Daten Und Abfragen in Natürlicher Sprache

DeepSearchQA Mehrstufiger Datensatz Zur Informationssuche Und Beantwortung Von Fragen

MCIF Multimodal Cross-Language Instruction Following Dataset

VenusBench-GD Plattformübergreifende Schnittstelle: Datensatz Verstehen

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

LongBench-Pro Long Context Comprehensive Evaluation Dataset

FirstAidQA Erste-Hilfe-Wissensfragen-Antworten-Datensatz

Spatial-SSRL-81k Spatial Awareness Self-Supervised Dataset

HumanSense Benchmark-Datensatz