KonIQ-10k: 감정 없는 이미지 품질 평가를 위한 딥러닝을 위한 생태학적으로 타당한 데이터베이스

이미지 품질 평가(IQA)를 위한 딥러닝 기법은 기존 데이터셋의 크기가 작아 제한을 받고 있다. 광범위한 데이터셋을 구축하기 위해서는 출판 가능한 콘텐츠를 생성하고 정확하게 주석을 달기 위해 막대한 자원이 필요하다. 우리는 지금까지 가장 큰 IQA 데이터셋인 KonIQ-10k를 체계적이고 확장 가능한 방식으로 제작했다. 이 데이터셋은 총 10,073장의 품질 점수 부여된 이미지로 구성되어 있으며, 왜곡의 진정성, 콘텐츠의 다양성, 품질과 관련된 지표를 고려해 생태학적 타당성(ecological validity)을 추구하는 최초의 '실외 데이터베이스(in-the-wild)'이다. 커뮤니티 기반의 평가(Crowdsourcing)를 활용하여 1,459명의 일반 사용자로부터 120만 건의 신뢰할 수 있는 품질 평가를 확보함으로써, 보다 일반화된 IQA 모델의 개발을 가능하게 했다. 또한, 새로운 딥러닝 모델인 KonCept512를 제안하며, 기존의 최신 기술 수준을 넘어서는 우수한 일반화 성능을 입증했다. 이 모델은 테스트 세트에서 0.921의 SROCC(Spearman Rank Order Correlation Coefficient)를 기록했으며, 현재 최고 수준의 LIVE-in-the-Wild 데이터셋에서 0.825의 SROCC를 달성한 기존 모델보다 뛰어난 성능을 보였다. KonCept512는 InceptionResNet 아키텍처를 기반으로 하며, 이전 모델보다 더 높은 해상도(512x384)에서 훈련되었고, 이는 핵심 성능 향상의 원천이 되었다. 상관관계 분석 결과, KonCept512는 각 테스트 이미지에 대해 약 9개의 주관적 평가를 수행한 것과 유사한 성능을 보였다.