9일 전

사진을 사진작가처럼 구성하기

{Weicai Zhong, Zhiguo Cao, Hao Lu, Ke Xian, Shuaiyuan Du, Chaoyi Hong}
사진을 사진작가처럼 구성하기
초록

우리는 구성 규칙을 명시적으로 모델링하는 것이 이미지 자르기(image cropping)에 유익함을 보여준다. 이미지 자르기는 전문 사진 촬영에서 예술적 구성의 자동화를 위한 유망한 방법으로 여겨지고 있다. 그러나 기존의 연구들은 이러한 전문 지식을 암묵적으로만 모델링하고 있으며, 예를 들어 비교 가능한 후보들 간의 순위 매기기를 통해 이를 구현한다. 자연스러운 구성 특성이 항상 특정한 규칙을 따르는 점에 착안하여, 우리는 이러한 규칙을 구별적(discriminative) 방식으로 학습하고, 더 중요한 것은 학습된 구성 관련 정보를 모델에 명시적으로 통합하는 방안을 제안한다. 이를 위해 구성 규칙을 인코딩하기 위해 '핵심 구성 맵(Key Composition Map, KCM)'이라는 개념을 도입한다. KCM은 다양한 구성 규칙 뒤에 숨겨진 공통적인 법칙을 드러내며, 자르기 모델이 구성에서 무엇이 중요한지를 인지하도록 안내할 수 있다. KCM을 기반으로, 우리는 새로운 '구성 기반 이미지 자르기' 파라다임을 제시하고, 구성 인지형 이미지 자르기를 구현할 수 있는 네트워크를 구현하였다. 두 가지 벤치마크에서 실시한 광범위한 실험을 통해 제안한 방법이 효과적이고 해석 가능하며 빠른 이미지 자르기를 가능하게 함을 입증하였다.