CA‑1 인간 선호도 정렬 데이터 세트

날짜

한 달 전

기관

오픈AI

발행 주소

huggingface.co

라이선스

CC BY 4.0

다운로드 도움말

CA‑1(Collective Alignment 1의 약자)은 OpenAI에서 2025년에 출시했습니다. 이 데이터는 AI 모델의 기본 동작에 대한 인간의 가치 판단과 선호도에 초점을 맞춥니다. 모델에서 생성된 콘텐츠와 주석 작성자의 평가를 결합한 인간 피드백 동작 데이터셋입니다.

이 데이터셋은 1,078개의 즉석 비교 항목과 1,012명의 주석자가 제공한 18,384개의 평가, 그리고 인구 통계학적 정보 및 점수 산정 근거로 구성되어 있습니다. 집단 간 정렬 차이 연구, 모델 행동 규범 설정, 그리고 가치 기반 보상 메커니즘 개발에 적합합니다.

데이터 구성:

  • 프롬프트 비교: 각 항목에는 합성 프롬프트와 4개의 해당 후보 응답(A~D)이 포함되어 있으며, 이는 다양한 응답 간의 가치 선호도 차이를 비교하는 데 사용됩니다.
  • 주석자: 이는 각 주석자의 기본 인구 통계 정보를 기록합니다. 여기에는 연령, 성별, 교육 수준, 출신 국가가 포함되며, 이를 통해 다양한 집단 간의 가치 선호도 차이를 분석할 수 있습니다.
  • 병합된 비교-주석자: 이 기능은 프롬프트, 후보 응답, 주석자의 평가와 주석자에 대한 맥락적 정보를 결합하여 완전한 프롬프트-응답-평가-인구 통계 맵을 생성합니다.