Educhat-sft-002-data-osm 교육 대화 데이터 세트
educhat-sft-002-data-osm 데이터 세트는 교육 분야에 초점을 맞춘 대화 시스템 데이터 세트입니다. 2023년 동중국사범대학 컴퓨터과학기술학원 EduNLP팀에서 개발했습니다. 관련 논문 결과는 다음과 같습니다.EduChat: 지능형 교육을 위한 대규모 언어 모델 기반 챗봇 시스템".
이 데이터 세트는 여러 개의 오픈 소스 중국어 및 영어 지침과 대화 데이터가 혼합된 것입니다. 중복 제거 처리를 거친 후에는 개방형 질의응답, 에세이 교정, 휴리스틱 교육, 정서적 지원, 과정 튜터링 등 다양한 교육 수직 분야 데이터를 포함하여 약 400만 개의 데이터 포인트가 포함됩니다. 각 데이터는 대화를 저장하는 목록과 데이터에 해당하는 system_prompt로 구성됩니다. 이 목록에는 대화가 Q, A 순서로 저장됩니다.
이 데이터 세트는 교육 분야에서 지능형 질의응답을 위한 대규모 언어 모델을 오픈 소스로 제공하는 것을 목표로 하는 EduChat 프로젝트의 일부입니다. 이 데이터 세트를 통해 Educhat은 자동 문제 설정, 숙제 채점, 정서적 지원, 과정 튜터링, 대학 입시 컨설팅 등 교육 현장에서 풍부한 기능을 제공하여 수많은 교사, 학생, 학부모에게 서비스를 제공하고 학생의 적성에 맞는 공정하고 정의로우며 따뜻함이 넘치는 지능형 교육을 실현하는 데 도움을 줍니다.
educhat-sft-002-data-osm.torrent
시딩 1다운로드 중 1완료됨 54총 다운로드 횟수 91