
* 이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.
ChatHaruhi는 32개의 중국어/영어 TV/애니메이션 캐릭터와 54,000개 이상의 시뮬레이션 대화를 포함하는 데이터 세트입니다.
대규모 언어 모델로 구축된 롤플레잉 챗봇은 폭넓은 주목을 받았지만, 특정한 가상 캐릭터를 모방하기 위해서는 더욱 진보된 기술이 필요합니다. 연구자들은 향상된 프롬프트와 스크립트에서 추출된 문자의 메모리를 통해 언어 모델을 제어하는 알고리즘을 제안했습니다. 연구진은 영화, 소설, 대본에서 코퍼스를 수집하고 구조화된 추출을 수행하여 23,000개 이상의 대화 메시지를 수집했습니다. 이러한 대화 데이터는 롤플레잉 언어 모델을 훈련하고 테스트하는 데 사용될 수 있습니다. 동시에 연구자들이 제안한 알고리즘을 사용하고 GPT3와 GPT4의 도움을 받아 연구자들은 이러한 캐릭터에 대한 27,000개 이상의 추가 대화를 생성했습니다.
ChatHaruhi-RolePlaying.torrent
시딩 1다운로드 중 2완료됨 185총 다운로드 횟수 742