Command Palette
Search for a command to run...
Arena-Write 글쓰기 생성 평가 데이터 세트
Arena-Write는 초장문 텍스트 생성 모델 평가를 위한 작문 작업 데이터셋으로, 싱가포르 기술디자인대학교와 칭화대학교 지식공학연구소가 공동으로 2025년에 발표했습니다. 관련 연구 논문은 다음과 같습니다. LongWriter-Zero: 강화 학습을 통한 초장문 텍스트 생성 마스터하기본 연구의 목표는 실제 사용 시나리오와 매우 유사한 환경에서 대규모 언어 모델이 장문의 콘텐츠 생성 및 복잡한 작문 작업에서 발휘하는 종합적인 역량을 체계적으로 평가하는 것입니다. 이 데이터셋은 실제 글쓰기 프롬프트로 구성된 100개의 사용자 글쓰기 과제를 포함하며, 각 과제는 해당 글쓰기 시나리오 유형으로 레이블링되어 있습니다. 과제는 소셜 미디어 게시물, 기사, 보고서 등 다양한 텍스트 형식을 포괄하며, 출력 길이 또한 수백 단어의 짧은 텍스트 과제부터 2,000단어 이상의 긴 텍스트 과제까지 다양합니다. 또한, 이 데이터셋은 글쓰기 프롬프트 외에도 동일한 과제에 대한 여러 주요 기준 모델의 생성 결과를 제공하여 다양한 모델 출력에 대한 비교 평가를 지원합니다.