Command Palette
Search for a command to run...
INFINITY-CHAT 실제 개방형 질문 답변 데이터셋
워싱턴 대학교가 카네기 멜론 대학교, 앨런 인공지능 연구소 및 기타 기관과 협력하여 2025년에 출시한 INFINITY-CHAT은 실제 사용자의 개방형 질문에 답하는 최초의 대규모 데이터 세트입니다. 관련 연구 논문은 다음과 같습니다... 인공 집단 지성: 언어 모델의 무한한 동질성 (그리고 그 너머) NeurIPS 2025 최우수 논문상(DB 트랙)을 수상한 이 논문은 개방형 언어 생성에서의 언어 모델 다양성, 인간 선호도의 차이, 그리고 "인공 군집 효과"와 같은 핵심 문제를 체계적으로 연구하는 것을 목표로 합니다. 이 데이터셋은 26,000개 이상의 실제 개방형 사용자 질문을 포함하고 있으며, 6개의 최상위 범주와 17개의 하위 범주로 구성된 포괄적인 질의 분류 시스템을 제공합니다. 또한 70개 이상의 언어 모델에서 생성된 답변과 31,250개의 사용자 주석(절대 점수 및 쌍별 선호도 포함)이 포함되어 있으며, 각 샘플은 평균 25명의 주석자가 평가했습니다. 데이터셋은 개방형 질문 코퍼스, 다단계 분류 레이블, 모델 생성 결과, 대규모 사용자 피드백의 네 가지 주요 부분으로 구성됩니다.