Date

il y a un an

Taille

1.43 MB

Organisation

URL de publication

github.com

Balises

LLM

Traitement Du Langage Naturel

Entraînement Du Modèle

NCIFD (National Culture Instruction-Following Dataset) est un ensemble de données de réglage fin de la culture nationale pour les grands modèles construits par le Centre national de surveillance des ressources linguistiques et de recherche pour les langues minoritaires de l'Université Minzu de Chine. Il contient 151 159 éléments de données, dont 10 000 sont accessibles au public, couvrant sept domaines principaux : l'architecture, les vêtements, l'artisanat, l'alimentation, l'étiquette, la langue et les coutumes. L'ensemble de données se compose principalement de deux parties :

NCSI (Auto-apprentissage de la culture nationale):

Grâce au cadre Self-Instruct, un grand modèle de langage est utilisé pour générer un ensemble de données, et les données générées sont examinées pour en vérifier la qualité.

NCQA (National Culture Self-QA):

Grâce au cadre Self-QA, un grand modèle de langage est utilisé pour générer des paires QA, et les paires QA générées sont examinées pour leur qualité afin de garantir la clarté des questions et l'exhaustivité, l'exactitude et la clarté des réponses.

Citation

@article{luo2025ncifd, titre={NCIFD : Ensemble de données pour l’ajustement fin de la culture ethnique dans les grands modèles}, author={Luo He et Zhang Ting et Sun Yuan et Pengmao Cairang et Dawa Cairin}, journal={Journal chinois de traitement de l'information}, volume={39}, nombre={2}, pages={41–51}, année={2025} }

NCIFD.torrent

Partage 1Téléchargement 0Terminé 169Total des téléchargements 409

NCIFD/
- README.md
  1.47 KB
- README.txt
  2.94 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

dans 7 heures

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

il y a un mois

Transfermarkt Football 足球转会数据集

il y a 2 mois

Ensemble De Données Sur Le Risque d'AVC

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Télécharger

Discuter sur Discord

Date

il y a un an

Taille

1.43 MB

Organisation

URL de publication

github.com

Balises

LLM

Traitement Du Langage Naturel

Entraînement Du Modèle

NCSI (Auto-apprentissage de la culture nationale):

Grâce au cadre Self-Instruct, un grand modèle de langage est utilisé pour générer un ensemble de données, et les données générées sont examinées pour en vérifier la qualité.

NCQA (National Culture Self-QA):

Grâce au cadre Self-QA, un grand modèle de langage est utilisé pour générer des paires QA, et les paires QA générées sont examinées pour leur qualité afin de garantir la clarté des questions et l'exhaustivité, l'exactitude et la clarté des réponses.

Citation

NCIFD.torrent

Partage 1Téléchargement 0Terminé 169Total des téléchargements 409

NCIFD/
- README.md
  1.47 KB
- README.txt
  2.94 KB

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

dans 7 heures

Ensemble De Données Sur Les Sentiments Liés Aux Films

il y a 4 jours

Base De Données Sur Les Maladies Des Feuilles De Riz

il y a 18 jours

Ensemble De Données d'inférence Visuelle VisCoR-55K

il y a 25 jours

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

il y a un mois

Transfermarkt Football 足球转会数据集

il y a 2 mois

Ensemble De Données Sur Le Risque d'AVC

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données De Mise Au Point De La Culture Nationale Du NCIFD

Citation

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Mise Au Point De La Culture Nationale Du NCIFD

Citation

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données Sur Les Sentiments Liés Aux Films

Base De Données Sur Les Maladies Des Feuilles De Riz

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

Transfermarkt Football 足球转会数据集

Ensemble De Données Sur Le Risque d'AVC

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Mise Au Point De La Culture Nationale Du NCIFD

Citation

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données Sur Les Sentiments Liés Aux Films

Base De Données Sur Les Maladies Des Feuilles De Riz

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

Transfermarkt Football 足球转会数据集

Ensemble De Données Sur Le Risque d'AVC

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données Sur Les Sentiments Liés Aux Films

Base De Données Sur Les Maladies Des Feuilles De Riz

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

Transfermarkt Football 足球转会数据集

Ensemble De Données Sur Le Risque d'AVC

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données Sur Les Sentiments Liés Aux Films

Base De Données Sur Les Maladies Des Feuilles De Riz

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données Sur La Détection Des Feux De Forêt Et De La Fumée À Longue Distance

Transfermarkt Football 足球转会数据集

Ensemble De Données Sur Le Risque d'AVC