Datum

vor einem Jahr

Größe

1.43 MB

Organisation

Veröffentlichungs-URL

github.com

Tags

LLM

Natürliche Sprachverarbeitung

Modelltraining

NCIFD (National Culture Instruction-Following Dataset) ist ein nationaler Kultur-Feinabstimmungsdatensatz für große Modelle, der vom National Language Resource Monitoring and Research Center for Minority Languages der Minzu University of China erstellt wurde. Es enthält 151.159 Datenelemente, von denen 10.000 öffentlich verfügbar sind, und deckt sieben Hauptbereiche ab: Architektur, Kleidung, Handwerk, Essen, Etikette, Sprache und Bräuche. Der Datensatz besteht im Wesentlichen aus zwei Teilen:

NCSI (Nationale Kulturselbstlehre):

Mithilfe des Self-Instruct-Frameworks wird ein großes Sprachmodell zum Generieren eines Datensatzes verwendet und die Qualität der generierten Daten geprüft.

NCQA (Nationale Kultur-Selbst-QA):

Mithilfe des Self-QA-Frameworks wird ein großes Sprachmodell zum Generieren von QA-Paaren verwendet. Die generierten QA-Paare werden auf ihre Qualität geprüft, um die Klarheit der Fragen und die Vollständigkeit, Genauigkeit und Klarheit der Antworten sicherzustellen.

NCIFD.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 126Gesamtdownloads 349

NCIFD/
- README.md
  1.47 KB
- README.txt
  2.94 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Download

Auf Discord diskutieren

Datum

vor einem Jahr

Größe

1.43 MB

Organisation

Veröffentlichungs-URL

github.com

Zugehörige Datensätze

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

vor 2 Monaten

Sutra 10B Vortrainings- Und Trainingsdatensatz

vor 3 Monaten

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

vor 5 Monaten

RoVid-X-Roboter-Videogenerierungsdatensatz

vor 2 Monaten

Patientensegmentierungsdatensatz

vor 5 Monaten

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor 6 Monaten

MCIF Multimodal Cross-Language Instruction Following Dataset

vor 6 Monaten

TxT360-3efforts Multi-Task Inference Dataset

vor 6 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

NCIFD-Datensatz Zur Feinabstimmung Der Nationalen Kultur

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

NCIFD-Datensatz Zur Feinabstimmung Der Nationalen Kultur

Zugehörige Datensätze

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Sutra 10B Vortrainings- Und Trainingsdatensatz

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

RoVid-X-Roboter-Videogenerierungsdatensatz

Patientensegmentierungsdatensatz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

NCIFD-Datensatz Zur Feinabstimmung Der Nationalen Kultur

Zugehörige Datensätze

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Sutra 10B Vortrainings- Und Trainingsdatensatz

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

RoVid-X-Roboter-Videogenerierungsdatensatz

Patientensegmentierungsdatensatz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Sutra 10B Vortrainings- Und Trainingsdatensatz

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

RoVid-X-Roboter-Videogenerierungsdatensatz

Patientensegmentierungsdatensatz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

Zugehörige Datensätze

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Sutra 10B Vortrainings- Und Trainingsdatensatz

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

RoVid-X-Roboter-Videogenerierungsdatensatz

Patientensegmentierungsdatensatz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset