DPO-zh-en-emoji 이모티콘 질의응답 데이터세트
* 이 데이터 세트는 온라인에서 이용 가능합니다.여기를 클릭하여 이동하세요.
데이터 세트 소개
DPO-zh-en-emoji 데이터 세트는 shareAI가 2024년에 출시한 대규모 언어 모델의 미세 조정을 위해 특별히 설계된 데이터 세트입니다. 여기서 "DPO"는 Direct Preference Optimization의 약자입니다. 이 데이터 세트에는 많은 수의 질문-답변 쌍이 포함되어 있습니다. 각 질문에는 중국어와 영어 두 가지 버전의 답변이 있습니다. 답변에는 이모티콘을 포함한 재미있고 유머러스한 요소도 포함되어 있습니다. 연구팀은 Zhihu, 논리적 추론, Retarded Forum에서 몇 가지 질문을 질의로 신중하게 선택하고, llama3 70b 지시 모델을 사용하여 각 질의에 대한 답변의 중국어 버전과 영어 버전을 샘플링하여 생성했습니다. 이러한 디자인은 다국어 채팅 모델의 언어 스타일 선호도를 활성화하고 모델이 생성하는 콘텐츠의 품질을 개선하고 인간의 선호도에 부합하도록 하는 데 도움이 됩니다.
DPO-zh-en-emoji.torrent
시딩 1다운로드 중 1완료됨 66총 다운로드 횟수 173