11일 전

KonX: 크로스 해상도 이미지 품질 평가

Oliver Wiedemann, Vlad Hosu, Shaolin Su, Dietmar Saupe
KonX: 크로스 해상도 이미지 품질 평가
초록

스케일 불변성(scale-invariance)은 컴퓨터 비전의 여러 하위 분야에서 여전히 해결되지 않은 과제이다. 예를 들어, 객체 레이블은 스케일에 따라 일정하게 유지되어야 하지만, 대부분의 경우 모델의 예측 결과는 이를 따르지 않는다. 특히 진짜 레이블이 표현 스케일에 따라 변화하는 작업에서는 이 문제가 더욱 심화된다. 이미지 품질 평가(Image Quality Assessment, IQA)에서는 하향 샘플링(downsampling)이 왜곡 요소(예: 블러 또는 압축 아티팩트)를 약화시켜 주관적 평가 연구에서 긍정적인 인상을 줄 수 있다. 따라서 인지적 이미지 품질을 정확히 예측하기 위해서는, 모델의 부족으로 인해 발생하는 해상도에 따라 달라지는 오차뿐만 아니라, 진짜 레이블의 인지적 이동( perceptual label shifts)까지 모두 고려해야 한다. 본 연구는 이 두 가지 문제를 별도로 분리하여 분석할 수 있도록 설계된 새로운 교차 해상도 IQA 데이터베이스인 KonX를 제안함으로써, 이 분야에서 처음으로 체계적인 연구를 수행한다. 본 논문의 기여는 다음과 같다: 1. KonX를 통해 표현 해상도의 변화로 인한 레이블 이동 현상에 대한 실증적 증거를 제시한다. 2. 기존 객관적 IQA 방법들이 스케일 편향(scale bias)을 가지며, 이로 인해 예측 성능이 저하됨을 보여준다. 3. 최근 트랜스포머 기반 모델을 포함한 기존 최고 수준의 IQA 모델보다 성능이 향상된 다중 스케일 및 다중 컬럼 구조를 갖춘 딥 신경망(DNN) 아키텍처를 제안한다. 따라서 본 연구는 이미지 품질 평가 분야에서 새로운 연구 문제를 제기하고, 동시에 이를 해결하는 방안을 제시한다.

KonX: 크로스 해상도 이미지 품질 평가 | 최신 연구 논문 | HyperAI초신경