Educhat-sft-002-data-osm Datensatz Zum Bildungsdialog
Datum
Größe
Veröffentlichungs-URL
Kategorien
Der Datensatz educhat-sft-002-data-osm ist ein Dialogsystem-Datensatz mit Schwerpunkt auf dem Bildungsbereich. Es wurde 2023 vom EduNLP-Team der School of Computer Science and Technology der East China Normal University entwickelt. Die zugehörigen Ergebnisse der Studie lauten:EduChat: Ein groß angelegtes, sprachmodellbasiertes Chatbot-System für intelligente Bildung".
Der Datensatz ist eine Mischung aus mehreren Open-Source-Anweisungen und Dialogdaten auf Chinesisch und Englisch. Nach der Deduplizierung enthält es etwa 4 Millionen Datenpunkte, darunter Daten aus verschiedenen vertikalen Bildungsbereichen wie offene Fragen und Antworten, Aufsatzkorrektur, heuristisches Lehren, emotionale Unterstützung und Kursbetreuung. Jedes Datenelement besteht aus einer Liste, die den Dialog speichert, und einer den Daten entsprechenden Systemaufforderung. Die Liste speichert die Konversationen in der Reihenfolge F, A.
Dieser Datensatz ist Teil des EduChat-Projekts, dessen Ziel darin besteht, Open-Source-Sprachmodelle im großen Maßstab für die intelligente Beantwortung von Fragen im Bildungsbereich bereitzustellen. Mithilfe dieses Datensatzes kann Educhat umfangreiche Funktionen für Bildungsszenarien bereitstellen, wie etwa die automatische Aufgabenstellung, die Benotung von Hausaufgaben, emotionale Unterstützung, Kursnachhilfe, Beratung bei der Hochschulaufnahmeprüfung usw. Damit kommt Educhat einer großen Zahl von Lehrern, Schülern und Eltern zugute und trägt dazu bei, eine intelligente Bildung zu erreichen, die auf die Fähigkeiten der Schüler zugeschnitten, fair und gerecht sowie herzlich ist.