HyperAI

Ensemble De Données De Mise Au Point De La Culture Nationale Du NCIFD

Date

il y a 4 mois

Taille

1.43 MB

Organisation

URL de publication

github.com

NCIFD (National Culture Instruction-Following Dataset) est un ensemble de données de réglage fin de la culture nationale pour les grands modèles construits par le Centre national de surveillance des ressources linguistiques et de recherche pour les langues minoritaires de l'Université Minzu de Chine. Il contient 151 159 éléments de données, dont 10 000 sont accessibles au public, couvrant sept domaines principaux : l'architecture, les vêtements, l'artisanat, l'alimentation, l'étiquette, la langue et les coutumes.

L'ensemble de données se compose principalement de deux parties :

  1. NCSI (Auto-apprentissage de la culture nationale):
    • Grâce au cadre Self-Instruct, un grand modèle de langage est utilisé pour générer un ensemble de données, et les données générées sont examinées pour en vérifier la qualité.
  2. NCQA (National Culture Self-QA):
    • Grâce au cadre Self-QA, un grand modèle de langage est utilisé pour générer des paires QA, et les paires QA générées sont examinées pour leur qualité afin de garantir la clarté des questions et l'exhaustivité, l'exactitude et la clarté des réponses.
NCIFD.torrent
Partage 2Téléchargement 1Terminés 31Téléchargements totaux 77
  • NCIFD/
    • README.md
      1.47 KB
    • README.txt
      2.94 KB
      • data/
        • NCIFD-main.zip
          1.43 MB