Evol-캐릭터 캐릭터 설정 및 대화 데이터 세트
이 데이터 세트는 GPT3.5와 GPT4에 의해 생성되었습니다. 데이터의 합리적인 사용을 보장하기 위해 현재는 일부 데이터만 공개되어 있습니다. 공개 데이터는 3개의 파일로 구성되어 있으며, 각 파일에는 200개 캐릭터의 설정과 대화가 포함되어 있습니다.
데이터 구조
- evol-character-gpt3.5.json
- evol-character-male-gpt3.5.json
- evol-character-gpt4.json
자세한 내용은 다음과 같습니다.
evol-character-gpt3.5.json
: 이 데이터 세트에는 200개의 다양한 문자가 포함되어 있습니다. 각 역할에 대한 데이터는 지시와 대화의 두 부분으로 나뉩니다. 지시 섹션은 캐릭터의 성격, 경험 및 기타 특성을 설명하는 반면, 대화 섹션에는 10개 그룹의 대화가 포함되어 있습니다(그러나 일부 캐릭터는 후처리로 인해 그룹이 10개보다 적을 수 있음).evol-character-male-gpt3.5.json
: 또한 200개의 문자를 포함하고 있으며, 데이터 구조는 evol-character-gpt3.5.json과 동일합니다.evol-character-gpt4.json
: 여기에는 200개의 역할이 포함되어 있으며, 데이터는 gpt3.5 버전보다 더 자세하고 정교합니다. 각 역할의 데이터는 설정과 IQA의 두 부분으로 나뉩니다. 설정 부분에서는 등장인물의 성격, 경험 및 기타 특징을 자세히 설명하는 반면, iqa 부분에는 등장인물과 대화하는 사람들의 성격 설정과 그들 간의 여러 차례 대화가 포함됩니다. 각 캐릭터의 데이터에는 관련된 세 캐릭터와 해당 캐릭터와의 대화가 포함됩니다.
장점
- 정교한 캐릭터 설정 데이터:이 데이터 세트는 기존 오픈 소스 롤플레잉 교육 데이터의 역할 설정이 부족하다는 일반적인 문제를 보완합니다. 여기에는 캐릭터 정체성, 언어 스타일, 배경 스토리 등 다각적인 측면에서 자세한 정보가 제공됩니다. 특히 GPT-4 버전에서는 대화자의 정체성에 대한 설정도 추가되어 데이터가 더욱 완전하고 풍부해졌습니다.
- 다양한 성격 특성:이 데이터 세트는 가능한 가장 광범위한 ACG 캐릭터 성격을 포괄하여 중복을 낮추고 풍부함을 보장합니다.
- 생생한 언어와 동작 묘사: 이 데이터 세트는 캐릭터 간의 대화를 담고 있을 뿐만 아니라 캐릭터의 행동에 대한 설명도 추가하여 대화를 보다 생생하고 사실적으로 만들어 사용자에게 보다 풍부한 롤플레잉 경험을 제공할 것입니다.
- 일반 롤플레잉 데이터 생성 프레임워크:이 데이터 세트는 일반적인 롤플레잉 데이터 생성 프레임워크를 제공하여 OpenAI API의 롤플레잉 기능을 최대한 활용합니다. 이 프레임워크에서 생성된 데이터는 미세 조정 및 RAG에 사용됩니다. 현재 프레임워크 코드는 테스트 및 최적화 중이며 가까운 시일 내에 공개될 것으로 예상됩니다.
Evol-character.torrent
시딩 1다운로드 중 1완료됨 99총 다운로드 횟수 172