NCIFD 국가 문화 미세 조정 데이터 세트
NCIFD(National Culture Instruction-Following Dataset)는 중국 민족대학 소수민족 언어자원 모니터링 연구센터가 구축한 대규모 모델을 위한 국가적 문화 미세 조정 데이터 세트입니다. 여기에는 건축, 의복, 공예, 음식, 예절, 언어, 관습 등 7개 주요 분야를 다루는 총 151,159개의 데이터 항목이 포함되어 있으며, 그 중 10,000개가 공개적으로 이용 가능합니다.
데이터 세트는 주로 두 부분으로 구성됩니다.
- NCSI(국가문화자율학습):
- Self-Instruct 프레임워크를 통해 대규모 언어 모델을 사용하여 데이터 세트를 생성하고, 생성된 데이터는 품질을 위해 검토됩니다.
- NCQA(국가문화 자체품질평가):
- Self-QA 프레임워크를 통해 대규모 언어 모델을 사용하여 QA 쌍을 생성하고, 생성된 QA 쌍의 품질을 검토하여 질문의 명확성과 답변의 완전성, 정확성, 명확성을 보장합니다.
NCIFD.torrent
시딩 2다운로드 중 1완료됨 31총 다운로드 횟수 77