HyperAIHyperAI

Command Palette

Search for a command to run...

zh-meme-sft-8k Ensemble De Données Sur La Culture Des Mèmes Internet Chinois

Date

il y a 4 heures

Licence

MIT

Balises

zh-meme-sft-8k est un jeu de données d'entraînement à la culture des mèmes internet chinois, principalement utilisé pour former des modèles de dialogue à comprendre et à utiliser les mèmes internet populaires. Ce jeu de données est constitué d'interactions par commentaires sur des plateformes de médias sociaux telles que Douyin, Xiaohongshu et Bilibili, et a fait l'objet de plusieurs cycles de nettoyage et d'amélioration. Il se caractérise par des structures de dialogue authentiques, une excellente conservation des mèmes populaires malgré ces multiples nettoyages, et une standardisation au format ChatML.

Composition de l'ensemble de données:

  • Ensemble d'entraînement : 7 377 échantillons, dont 851 TP3T
  • Ensemble de validation : 868 échantillons, représentant 101 TP3T
  • Ensemble de test : 435 échantillons, représentant 51 % de TP3T

répartition de la hiérarchie des dialogues :

  • Conversation de niveau 1 (messages - commentaires) : Environ 401 TP 3T
  • Dialogue de niveau 2 (commentaires-réponses) : Environ 601 TP3T

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp