Diesen Datensatz verwenden Auf Discord diskutieren

Datum

vor 3 Monaten

Organisation

Lizenz

MIT

Datenstruktur

Dieser Datensatz enthält zwei Teilmengen: Standardmäßig: Wird für das Training und das überwachte Feinabstimmen (SFT) verwendet.

problem(string): Problemstellung (Eingabe)
Antwort (Zeichenkette): Eine Memento-formatierte Inferenzantwort mit Block-/Zusammenfassungs-Tags.
Domäne (Zeichenkette): Die Domäne, zu der die Daten gehören (z. B. Code, Mathematik, Naturwissenschaften).
Quelle (Zeichenkette): Die ursprüngliche Datenquelle (aus OpenThoughts-v3)
Schwierigkeitsgrad (int): Der Schwierigkeitsgrad des Problems vollständig: Wird für detaillierte Recherchen oder die Verarbeitung von Pipelines verwendet. Zusätzlich zu den oben genannten Feldern enthält es auch detaillierte Informationen über die Zwischenverarbeitungsschritte:
sentences(list[string]): Eine Liste von Sätzen, die aus der Antwort abgeleitet wurden und für eine detaillierte Modellierung und Analyse verwendet werden.
blocks(list[list[int]]): Begrenzungsindizes der Inferenzblöcke, wobei jedes Element [start_idx, end_idx] ist und den Satzbereich darstellt, der diesem Block entspricht.
block_summaries(list[string]): Eine Zusammenfassung der einzelnen Phasen jedes Blocks, die den Denkprozess der progressiven Komprimierung und Abstraktion widerspiegelt.

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Command Palette

OpenMementos Kontextspeicher Komprimierter Datensatz

Datenstruktur

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

OpenMementos Kontextspeicher Komprimierter Datensatz

Datenstruktur

Zugehörige Datensätze

Transfermarkt Fußballdatensatz

Datensatz Zu Maisblattkrankheiten

Datensatz Zu Apfelblattkrankheiten

PanScale Remote Sensing Pancolor Sharpening Dataset

MIA-Datensatz Für Mehrstufige Inferenz Und Entscheidungstrajektorien

Schlaganfallrisiko-Datensatz

Datensatz Zur Erkennung Von Spam-E-Mails

Datensatz „Einfache Sprachfragen“

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Datensatz Für Kreative Aufgabenanweisungen Für Kreativprofis

Historischer Datensatz Zu Pandemien Und Epidemien Weltweit

Datensatz Zur Psychischen Gesundheit Und Zum Burnout Von Studierenden

zh-meme-sft-8k Chinesischer Internet-Meme-Kultur-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

Klinischer Datensatz Zu Lungenkrebs

Open-RL Inferenzproblem-Datensatz

Simulationsdatensatz Für Unerwünschte Arzneimittelwirkungen

Pan-Cancer scRNA-Seq Cancer Single-Cell Transcriptional Atlas Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

OpenMementos Kontextspeicher Komprimierter Datensatz

Datenstruktur

Zugehörige Datensätze

Transfermarkt Fußballdatensatz

Datensatz Zu Maisblattkrankheiten

Datensatz Zu Apfelblattkrankheiten

PanScale Remote Sensing Pancolor Sharpening Dataset

MIA-Datensatz Für Mehrstufige Inferenz Und Entscheidungstrajektorien

Schlaganfallrisiko-Datensatz

Datensatz Zur Erkennung Von Spam-E-Mails

Datensatz „Einfache Sprachfragen“

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Datensatz Für Kreative Aufgabenanweisungen Für Kreativprofis

Historischer Datensatz Zu Pandemien Und Epidemien Weltweit

Datensatz Zur Psychischen Gesundheit Und Zum Burnout Von Studierenden

zh-meme-sft-8k Chinesischer Internet-Meme-Kultur-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

Klinischer Datensatz Zu Lungenkrebs

Open-RL Inferenzproblem-Datensatz

Simulationsdatensatz Für Unerwünschte Arzneimittelwirkungen

Pan-Cancer scRNA-Seq Cancer Single-Cell Transcriptional Atlas Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

Transfermarkt Fußballdatensatz

Datensatz Zu Maisblattkrankheiten

Datensatz Zu Apfelblattkrankheiten

PanScale Remote Sensing Pancolor Sharpening Dataset

MIA-Datensatz Für Mehrstufige Inferenz Und Entscheidungstrajektorien

Schlaganfallrisiko-Datensatz

Datensatz Zur Erkennung Von Spam-E-Mails

Datensatz „Einfache Sprachfragen“

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Datensatz Für Kreative Aufgabenanweisungen Für Kreativprofis

Historischer Datensatz Zu Pandemien Und Epidemien Weltweit

Datensatz Zur Psychischen Gesundheit Und Zum Burnout Von Studierenden

zh-meme-sft-8k Chinesischer Internet-Meme-Kultur-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

Klinischer Datensatz Zu Lungenkrebs

Open-RL Inferenzproblem-Datensatz

Simulationsdatensatz Für Unerwünschte Arzneimittelwirkungen

Pan-Cancer scRNA-Seq Cancer Single-Cell Transcriptional Atlas Dataset

Zugehörige Datensätze

Transfermarkt Fußballdatensatz