Command Palette
Search for a command to run...
zh-meme-sft-8k Ensemble De Données Sur La Culture Des Mèmes Internet Chinois
zh-meme-sft-8k est un jeu de données d'entraînement à la culture des mèmes internet chinois, principalement utilisé pour former des modèles de dialogue à comprendre et à utiliser les mèmes internet populaires. Ce jeu de données est constitué d'interactions par commentaires sur des plateformes de médias sociaux telles que Douyin, Xiaohongshu et Bilibili, et a fait l'objet de plusieurs cycles de nettoyage et d'amélioration. Il se caractérise par des structures de dialogue authentiques, une excellente conservation des mèmes populaires malgré ces multiples nettoyages, et une standardisation au format ChatML.
Composition de l'ensemble de données:
- Ensemble d'entraînement : 7 377 échantillons, dont 851 TP3T
- Ensemble de validation : 868 échantillons, représentant 101 TP3T
- Ensemble de test : 435 échantillons, représentant 51 % de TP3T
répartition de la hiérarchie des dialogues :
- Conversation de niveau 1 (messages - commentaires) : Environ 401 TP 3T
- Dialogue de niveau 2 (commentaires-réponses) : Environ 601 TP3T
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.