인간 스타일 선호도 이미지 이미지 생성 선호도 데이터 세트
인간 스타일 선호도 이미지 데이터 세트는 텍스트-이미지 생성 모델을 평가하기 위한 인간이 주석을 단 데이터 세트입니다. Rapidata는 Rapidata Python API를 통해 Rapidata 플랫폼의 혁신적인 데이터 주석 기술을 사용하여 단 4일 만에 이 데이터를 수집하여 2025년에 공개했습니다. 이 데이터 세트는 두 장의 사진을 보여주고 참가자에게 어느 사진이 덜 이상하거나 부자연스러워 보이는지 묻는 방식으로 이미지 생성 모델에 대한 인간의 일관성 평가를 수집합니다. 여기에는 100시간 이내에 완료된 120만 개 이상의 인간 일관성 투표가 포함되어 있으며, 이는 Rapidata 플랫폼이 데이터 수집 속도 면에서 우위를 가지고 있음을 보여줍니다. 이 데이터 세트는 대규모, 전 세계적 대표성, 다양한 프롬프트, 주요 모델 비교의 특징을 가지고 있습니다. 이 데이터 세트는 새로운 이미지 생성 모델 벤치마킹, 생성 모델에 대한 더 나은 평가 지표 개발, AI 생성 이미지에 대한 글로벌 선호도 파악, 이미지 생성 모델 훈련 및 미세 조정, 문화 간 미적 선호도 연구에 유용합니다.
데이터 세트의 구성은 대규모 인간 투표에만 의존하는 것이 아니라 전 세계의 다양한 참여자를 포괄하여 데이터의 지리적, 문화적 대표성을 보장합니다. 또한, 데이터 세트를 구성하는 동안 신중하게 설계된 프롬프트를 사용하여 이미지 생성 모델의 다양한 측면을 테스트하고, 이를 통해 데이터 세트의 포괄성과 심도를 보장했습니다.
이 데이터 세트는 새로운 이미지 생성 모델 벤치마킹, 생성 모델에 대한 평가 지표 개발, 전 세계 AI 생성 이미지에 대한 선호도 파악, 이미지 생성 모델 교육 및 미세 조정, 문화 간 미적 선호도 연구 등을 포함하되 이에 국한되지 않는 다양한 응용 프로그램 시나리오에 적합합니다.