Educhat-sft-002-data-osm Ensemble De Données De Dialogue Éducatif
Date
Taille
URL de publication
L'ensemble de données educhat-sft-002-data-osm est un ensemble de données de système de dialogue axé sur le domaine de l'éducation. Il a été développé par l'équipe EduNLP de l'École d'informatique et de technologie de l'Université normale de Chine orientale en 2023. Les résultats de l'article associé sont "EduChat : un système de chatbot à grande échelle basé sur un modèle linguistique pour une éducation intelligente".
L'ensemble de données est un mélange de plusieurs instructions et données de dialogue open source en chinois et en anglais. Après le traitement de déduplication, il contient environ 4 millions de points de données, y compris diverses données de domaine vertical de l'éducation telles que les questions et réponses ouvertes, la correction des dissertations, l'enseignement heuristique, le soutien émotionnel et le tutorat de cours. Chaque élément de données est constitué d'une liste stockant le dialogue et d'une invite système correspondant aux données. La liste stocke les conversations dans l'ordre Q, A.
Cet ensemble de données fait partie du projet EduChat, qui vise à fournir des modèles linguistiques open source à grande échelle pour répondre intelligemment aux questions dans le domaine de l'éducation. Grâce à cet ensemble de données, Educhat peut fournir des fonctions riches dans des scénarios éducatifs, tels que la définition automatique de questions, la notation des devoirs, le soutien émotionnel, le tutorat de cours, la consultation pour les examens d'entrée à l'université, etc., au service d'un grand nombre d'enseignants, d'étudiants et de parents, et contribuer à réaliser une éducation intelligente, adaptée aux aptitudes des étudiants, juste et équitable, et pleine de chaleur.