Educhat-sft-002-data-osm 教育领域对话数据集
educhat-sft-002-data-osm 数据集是一个专注于教育领域的对话系统数据集,它由华东师范大学计算机科学与技术学院的 EduNLP 团队于 2023 年开发,相关论文成果为「EduChat: A Large-Scale Language Model-based Chatbot System for Intelligent Education」。
数据集混合了多个开源的中英文指令和对话数据,经过去重处理后得到,大约包含 400 万个数据点,包含了多样化的教育垂直领域数据,如开放问答、作文批改、启发式教学、情感支持和课程辅导等。每条数据由一个存放对话的 list 和与数据对应的 system_prompt 组成。 list 中按照 Q,A 顺序存放对话。
该数据集是 EduChat 项目的一部分,该项目旨在为教育领域提供智能问答的开源大规模语言模型。通过这个数据集,EduChat 能够提供教育场景下自动出题、作业批改、情感支持、课程辅导、高考咨询等丰富功能,服务于广大老师、学生和家长群体,助力实现因材施教、公平公正、富有温度的智能教育。
educhat-sft-002-data-osm.torrent
做种 1正在下载 1已完成 51总下载次数 87