HyperAIHyperAI

Command Palette

Search for a command to run...

zh-meme-sft-8k Chinesischer Internet-Meme-Kultur-Datensatz

Datum

vor 3 Stunden

Lizenz

MIT

Tags

zh-meme-sft-8k ist ein Datensatz zur Feinabstimmung der chinesischen Internet-Meme-Kultur. Er dient primär dem Training von Dialogmodellen, um ihnen das Verständnis und die Verwendung aktueller Internet-Memes zu ermöglichen. Der Datensatz basiert auf Kommentarinteraktionen auf Social-Media-Plattformen wie Douyin, Xiaohongshu und Bilibili und wurde mehrfach bereinigt und optimiert. Zu seinen Merkmalen gehören authentische Dialogstrukturen, die hohe Qualität der erhaltenen Trend-Memes nach mehreren Bereinigungsrunden sowie die Standardisierung im ChatML-Format.

Datensatzzusammensetzung:

  • Trainingsdatensatz: 7.377 Stichproben, davon 851 TP3T
  • Validierungsset: 868 Proben, davon 101 TP3T
  • Testdatensatz: 435 Proben, entsprechend 51 % von TP3T

Verteilung der Dialoghierarchie:

  • Konversation der Stufe 1 (Beiträge - Kommentare): Ungefähr 401 TP 3T
  • Dialogebene 2 (Kommentare-Antworten): Ungefähr 601 TP3T

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp