7시간 전

HPSv3: 광범위한 인간 선호도 점수로의 도전

Yuhang Ma, Xiaoshi Wu, Keqiang Sun, Hongsheng Li
HPSv3: 광범위한 인간 선호도 점수로의 도전
초록

텍스트-이미지 생성 모델 평가에는 인간의 인지와의 일치성이 요구되지만, 기존의 인간 중심 평가 지표는 데이터 커버리지의 제한, 최적화되지 않은 특징 추출, 비효율적인 손실 함수 등의 한계를 가지고 있다. 이러한 문제를 해결하기 위해 우리는 인간 선호도 점수 v3(HPSv3)를 제안한다. (1) 우리는 최신 생성 모델과 저품질에서 고품질에 이르는 실제 이미지까지 포함한 총 108만 개의 텍스트-이미지 쌍과 117만 개의 주석이 달린 쌍별 비교 데이터를 통합한, 처음으로 광범위한 스펙트럼을 갖춘 인간 선호도 데이터셋인 HPDv3를 공개한다. (2) 또한, 불확실성 인식 순위 손실(uncertainty-aware ranking loss)을 사용하여 훈련된 VLM 기반의 선호도 모델을 도입하여 세밀한 순위 매기기를 가능하게 한다. 더불어 HPSv3를 활용해 각 단계에서 최적의 이미지를 선택하는 반복적인 이미지 개선 기법인 인간 선호도 사슬(CoHP, Chain-of-Human-Preference)을 제안한다. 광범위한 실험을 통해 HPSv3가 광범위한 스펙트럼의 이미지 평가에 있어 강력한 평가 지표로 기능함을 입증하였으며, CoHP는 추가 데이터 없이도 효율적이고 인간의 선호와 일치하는 이미지 생성 품질 향상 방법임을 확인하였다. 코드와 데이터셋은 HPSv3 공식 홈페이지에서 제공된다.