15일 전

물리학적으로 영감을 받은 밀집 병합 네트워크를 통한 리라이팅

Amirsaeed Yazdani, Tiantong Guo, Vishal Monga
물리학적으로 영감을 받은 밀집 병합 네트워크를 통한 리라이팅
초록

이미지 재조명(image relighting)은 증강현실(AR) 응용 분야로부터 영감을 받아 주목받는 중요한 연구 주제로 부상하고 있다. 물리 기반의 전통적 방법과 투명한 박스 형태의 딥러닝 모델이 개발되어 왔다. 기존의 딥 네트워크는 학습을 통해 최신 기술 수준을 달성하였지만, 학습 데이터가 제한적이거나 문제의 현상학적 특성을 충분히 반영하지 못할 경우(예: 밀도 높은 그림자 추가 또는 제거 등), 성능이 저하될 수 있다. 본 논문에서는 신경망에 물리적 통찰을 통합하는 새로운 모델을 제안한다. 구체적으로, 본 방법은 새로운 조명 설정 하에서 재조명된 이미지를 생성하기 위해 두 가지 서로 다른 전략을 활용하고, 이를 가중치 맵(w)을 통해 융합한다. 첫 번째 전략에서는 모델이 재조명된 이미지에 대한 물질 반사율 파라미터(알베도)와 장면의 조명/기하학적 파라미터(그림자, shading)를 예측한다(이 전략을 내재 이미지 분해(intrinsic image decomposition, IID)라 부른다). 두 번째 전략은 순수한 투명한 박스 접근 방식으로, 모델이 학습 단계에서 지도 데이터(ground-truth 이미지)와 손실 항목(loss terms)를 기반으로 가중치를 최적화하고, 직접적으로 재조명된 출력을 생성한다(이 전략을 직접 접근(direct)이라 부른다). 제안하는 방법은 일대일 재조명 문제와 임의의 조명 간 재조명(any-to-any relighting) 문제 모두에 적용 가능하며, 각 문제 유형에 맞는 특화된 구성 요소를 도입함으로써 모델의 성능을 향상시킨다. 1) 일대일 재조명의 경우, 장면 내 표면의 법선 벡터(normal vectors)를 도입하여 광택과 그림자의 조절을 이미지에 적절히 반영한다. 2) 임의의 조명 간 재조명의 경우, 특징 추출 능력을 향상시키기 위해 아키텍처에 추가적인 다중 해상도 블록(multiscale block)을 제안한다. VIDIT 2020 및 VIDIT 2021 데이터셋(NTIRE 2021 재조명 챌린지에서 사용된 데이터셋)을 대상으로 수행한 실험 결과에 따르면, 제안한 방법은 전통적인 품질 지표 및 인지적 손실(perceptual loss) 측면에서 많은 최신 기술 대비 우수한 성능을 보였다.

물리학적으로 영감을 받은 밀집 병합 네트워크를 통한 리라이팅 | 최신 연구 논문 | HyperAI초신경