HelpSteer3 인간 선호도 데이터세트

날짜

2달 전

크기

247.99 MB

기관

엔비디아

발행 주소

huggingface.co

논문 URL

arxiv.org

라이선스

CC BY 4.0

HelpSteer3는 NVIDIA가 2025년에 발표한 인간 선호도 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.HelpSteer3-Preference: 다양한 작업 및 언어에 대한 사람이 주석을 단 선호도 데이터 공개"는 인간의 피드백과 강화 학습 기술을 통해 사용자 프롬프트에 대한 모델의 응답성을 개선하는 것을 목표로 합니다.

이 데이터셋은 40,476개의 선호도 샘플을 포함하고 있으며, 각 샘플에는 도메인, 언어, 맥락, 두 개의 응답, 두 응답 간의 전체 선호도 점수, 그리고 최대 3명의 주석 작성자가 제공한 개인 선호도 점수가 포함됩니다. 다국어 데이터(중국어, 한국어, 프랑스어, 스페인어, 일본어, 독일어, 러시아어, 포르투갈어, 이탈리아어, 베트남어, 네덜란드어)도 포함되어 있습니다.

헬프스티어3.torrent
시딩 1다운로드 중 0완료됨 19총 다운로드 횟수 77
  • HelpSteer3/
    • README.md
      1.4 KB
    • README.txt
      2.79 KB
      • data/
        • HelpSteer3.zip
          247.99 MB