Datum

vor 2 Jahren

Größe

5.59 MB

Organisation

Einführung in den Datensatz

Der DPO-zh-en-emoji-Datensatz ist ein Datensatz, der speziell für die Feinabstimmung großer Sprachmodelle entwickelt wurde und 2024 von shareAI eingeführt wurde, wobei „DPO“ für Direct Preference Optimization steht. Dieser Datensatz enthält eine große Anzahl von Frage-Antwort-Paaren. Zu jeder Frage gibt es zwei Antwortversionen, auf Chinesisch und auf Englisch. Die Antworten enthalten auch lustige und humorvolle Elemente, einschließlich der Verwendung von Emojis. Das Forschungsteam wählte sorgfältig einige Fragen aus Zhihu, logischem Denken und Retarded Forum als Abfragen aus und verwendete das llama3 70b-Anweisungsmodell, um für jede Abfrage eine chinesische und eine englische Version der Antwort zu erfassen und zu generieren. Ein solches Design trägt dazu bei, die Sprachstilpräferenzen des mehrsprachigen Chatmodells zu aktivieren und die Qualität der vom Modell generierten Inhalte sowie deren Übereinstimmung mit menschlichen Vorlieben zu verbessern.

DPO-zh-en-emoji.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 148Gesamtdownloads 393

DPO-zh-en-emoji/
- README.md
  1.58 KB
- README.txt
  3.16 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Verwandt Datensätze

SimpleQA – Datensatz Zur Bewertung Von Prägnanten, Faktischen Frage-Antwort-Systemen

vor einem Monat

INFINITY-CHAT Realer Offener Frage-Antwort-Datensatz

vor 2 Monaten

FirstAidQA Erste-Hilfe-Wissensfragen-Antworten-Datensatz

vor 2 Monaten

MCIF Multimodal Cross-Language Instruction Following Dataset

vor einem Monat

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor einem Monat

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 2 Jahren

Größe

5.59 MB

Organisation

Einführung in den Datensatz

DPO-zh-en-emoji.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 148Gesamtdownloads 393

DPO-zh-en-emoji/
- README.md
  1.58 KB
- README.txt
  3.16 KB

Verwandt Datensätze

DetectiumFire – Multimodaler Datensatz Zur Branderkennung

vor 2 Monaten

SSRB-Datensatz Für Semistrukturierte Daten Und Abfragen in Natürlicher Sprache

vor 2 Monaten

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

vor 3 Monaten

9.71 GB69

SimpleQA – Datensatz Zur Bewertung Von Prägnanten, Faktischen Frage-Antwort-Systemen

vor einem Monat

INFINITY-CHAT Realer Offener Frage-Antwort-Datensatz

vor 2 Monaten

FirstAidQA Erste-Hilfe-Wissensfragen-Antworten-Datensatz

vor 2 Monaten

MCIF Multimodal Cross-Language Instruction Following Dataset

vor einem Monat

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor einem Monat

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

DPO-zh-en-emoji Emoji-Fragen-Antwort-Datensatz

Einführung in den Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

DPO-zh-en-emoji Emoji-Fragen-Antwort-Datensatz

Einführung in den Datensatz

Verwandt Datensätze

DetectiumFire – Multimodaler Datensatz Zur Branderkennung

SSRB-Datensatz Für Semistrukturierte Daten Und Abfragen in Natürlicher Sprache

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

SimpleQA – Datensatz Zur Bewertung Von Prägnanten, Faktischen Frage-Antwort-Systemen

INFINITY-CHAT Realer Offener Frage-Antwort-Datensatz

FirstAidQA Erste-Hilfe-Wissensfragen-Antworten-Datensatz

MCIF Multimodal Cross-Language Instruction Following Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

DPO-zh-en-emoji Emoji-Fragen-Antwort-Datensatz

Einführung in den Datensatz

Verwandt Datensätze

DetectiumFire – Multimodaler Datensatz Zur Branderkennung

SSRB-Datensatz Für Semistrukturierte Daten Und Abfragen in Natürlicher Sprache

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

SimpleQA – Datensatz Zur Bewertung Von Prägnanten, Faktischen Frage-Antwort-Systemen

INFINITY-CHAT Realer Offener Frage-Antwort-Datensatz

FirstAidQA Erste-Hilfe-Wissensfragen-Antworten-Datensatz

MCIF Multimodal Cross-Language Instruction Following Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

KI mit KI entwickeln

HyperAI Newsletters

Verwandt Datensätze

DetectiumFire – Multimodaler Datensatz Zur Branderkennung

SSRB-Datensatz Für Semistrukturierte Daten Und Abfragen in Natürlicher Sprache

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

SimpleQA – Datensatz Zur Bewertung Von Prägnanten, Faktischen Frage-Antwort-Systemen

INFINITY-CHAT Realer Offener Frage-Antwort-Datensatz

FirstAidQA Erste-Hilfe-Wissensfragen-Antworten-Datensatz

MCIF Multimodal Cross-Language Instruction Following Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

Verwandt Datensätze

DetectiumFire – Multimodaler Datensatz Zur Branderkennung

SSRB-Datensatz Für Semistrukturierte Daten Und Abfragen in Natürlicher Sprache

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

SimpleQA – Datensatz Zur Bewertung Von Prägnanten, Faktischen Frage-Antwort-Systemen

INFINITY-CHAT Realer Offener Frage-Antwort-Datensatz

FirstAidQA Erste-Hilfe-Wissensfragen-Antworten-Datensatz

MCIF Multimodal Cross-Language Instruction Following Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen