Command Palette
Search for a command to run...
zh-meme-sft-8k Chinesischer Internet-Meme-Kultur-Datensatz
zh-meme-sft-8k ist ein Datensatz zur Feinabstimmung der chinesischen Internet-Meme-Kultur. Er dient primär dem Training von Dialogmodellen, um ihnen das Verständnis und die Verwendung aktueller Internet-Memes zu ermöglichen. Der Datensatz basiert auf Kommentarinteraktionen auf Social-Media-Plattformen wie Douyin, Xiaohongshu und Bilibili und wurde mehrfach bereinigt und optimiert. Zu seinen Merkmalen gehören authentische Dialogstrukturen, die hohe Qualität der erhaltenen Trend-Memes nach mehreren Bereinigungsrunden sowie die Standardisierung im ChatML-Format.
Datensatzzusammensetzung:
- Trainingsdatensatz: 7.377 Stichproben, davon 851 TP3T
- Validierungsset: 868 Proben, davon 101 TP3T
- Testdatensatz: 435 Proben, entsprechend 51 % von TP3T
Verteilung der Dialoghierarchie:
- Konversation der Stufe 1 (Beiträge - Kommentare): Ungefähr 401 TP 3T
- Dialogebene 2 (Kommentare-Antworten): Ungefähr 601 TP3T
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.