Diesen Datensatz verwenden Auf Discord diskutieren

Datum

vor 2 Jahren

Organisation

Veröffentlichungs-URL

ds1000-code-gen.github.io

Paper-URL

arxiv.org

Tags

Natürliche Sprachverarbeitung

DS-1000 ist ein Benchmark-Datensatz im Bereich der Codegenerierung, der 2022 gemeinsam von der Universität Hongkong, der Peking-Universität und anderen Universitäten veröffentlicht wurde. Der Schwerpunkt liegt auf Codegenerierungsaufgaben im Bereich der Datenwissenschaft. Die relevanten Papierergebnisse sind "DS-1000: Ein natürlicher und zuverlässiger Benchmark für die Codegenerierung in der Datenwissenschaft". Der Datensatz enthält 1.000 reale Data-Science-Fragen von StackOverflow und deckt 7 weit verbreitete Data-Science-Bibliotheken in Python ab, wie z. B. NumPy, Pandas, TensorFlow usw. Diese Probleme spiegeln nicht nur die Vielfalt und Praktikabilität in der realen Welt wider, sondern gewährleisten auch die Zuverlässigkeit und Richtigkeit der Lösungen durch eine automatische Bewertungsmethode mit mehreren Kriterien. Bei der Entwicklung von DS-1000 wurde besonders darauf geachtet, dass das Modell durch oberflächliche und semantische Störungen und schwierige Umschreibungen nicht einfach die Trainingsdaten auswendig lernt, sondern dass das Modell die Frage wirklich verstehen muss, um die richtige Antwort zu liefern. Die Struktur des Datensatzes ist sehr übersichtlich. Die Fragen unter jeder Bibliothek werden in zwei Eingabeformaten dargestellt: Vervollständigung und Einfügung. Jede Frage enthält Metainformationen, Eingabedaten, Referenzcode, Testcode usw. Dieses Design macht den Datensatz sowohl vollständig als auch überprüfbar. DS-1000 verfügt über ein breites Spektrum an Anwendungsszenarien und kann von der automatischen Codevervollständigung über Bildung und Lernen bis hin zur Leistungsbewertung eine wichtige Rolle spielen.

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden Auf Discord diskutieren

Datum

vor 2 Jahren

Organisation

Veröffentlichungs-URL

ds1000-code-gen.github.io

Paper-URL

arxiv.org

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

DS-1000-Benchmark-Datensatz Zur Codegenerierung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

DS-1000-Benchmark-Datensatz Zur Codegenerierung

Zugehörige Datensätze

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

DRACO Cross-Domain Deep Research Benchmark-Datensatz

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RubricHub_v1 Multi-Domain Generative Task Dataset

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

CL-bench Context Learning Evaluation Benchmark-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

Diabetes Mexiko (Mexiko-Diabetes-Datensatz)

MCIF Multimodal Cross-Language Instruction Following Dataset

LongBench-Pro Long Context Comprehensive Evaluation Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

DS-1000-Benchmark-Datensatz Zur Codegenerierung

Zugehörige Datensätze

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

DRACO Cross-Domain Deep Research Benchmark-Datensatz

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RubricHub_v1 Multi-Domain Generative Task Dataset

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

CL-bench Context Learning Evaluation Benchmark-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

Diabetes Mexiko (Mexiko-Diabetes-Datensatz)

MCIF Multimodal Cross-Language Instruction Following Dataset

LongBench-Pro Long Context Comprehensive Evaluation Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

DRACO Cross-Domain Deep Research Benchmark-Datensatz

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RubricHub_v1 Multi-Domain Generative Task Dataset

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

CL-bench Context Learning Evaluation Benchmark-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

Diabetes Mexiko (Mexiko-Diabetes-Datensatz)

MCIF Multimodal Cross-Language Instruction Following Dataset

LongBench-Pro Long Context Comprehensive Evaluation Dataset

Zugehörige Datensätze

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

DRACO Cross-Domain Deep Research Benchmark-Datensatz

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RubricHub_v1 Multi-Domain Generative Task Dataset

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

CL-bench Context Learning Evaluation Benchmark-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

Diabetes Mexiko (Mexiko-Diabetes-Datensatz)

MCIF Multimodal Cross-Language Instruction Following Dataset

LongBench-Pro Long Context Comprehensive Evaluation Dataset