HyperAI

NCIFD-Datensatz Zur Feinabstimmung Der Nationalen Kultur

Datum

vor 7 Monaten

Größe

1.43 MB

Organisation

Veröffentlichungs-URL

github.com

NCIFD (National Culture Instruction-Following Dataset) ist ein nationaler Kultur-Feinabstimmungsdatensatz für große Modelle, der vom National Language Resource Monitoring and Research Center for Minority Languages der Minzu University of China erstellt wurde. Es enthält 151.159 Datenelemente, von denen 10.000 öffentlich verfügbar sind, und deckt sieben Hauptbereiche ab: Architektur, Kleidung, Handwerk, Essen, Etikette, Sprache und Bräuche.

Der Datensatz besteht im Wesentlichen aus zwei Teilen:

  1. NCSI (Nationale Kulturselbstlehre):
    • Mithilfe des Self-Instruct-Frameworks wird ein großes Sprachmodell zum Generieren eines Datensatzes verwendet und die Qualität der generierten Daten geprüft.
  2. NCQA (Nationale Kultur-Selbst-QA):
    • Mithilfe des Self-QA-Frameworks wird ein großes Sprachmodell zum Generieren von QA-Paaren verwendet. Die generierten QA-Paare werden auf ihre Qualität geprüft, um die Klarheit der Fragen und die Vollständigkeit, Genauigkeit und Klarheit der Antworten sicherzustellen.
NCIFD.torrent
Seeding 1Herunterladen 0Abgeschlossen 62Gesamtdownloads 133
  • NCIFD/
    • README.md
      1.47 KB
    • README.txt
      2.94 KB
      • data/
        • NCIFD-main.zip
          1.43 MB