
초록
임플리시트 신경 표현(implicit neural representations, INR)은 초해상도, 3D 모델링 등 다양한 최종 작업을 위한 신호 및 이미지 표현에서 큰 인기를 끌고 있다. 대부분의 INR 아키텍처는 데이터 내 고주파 정보를 처리하기 위해 사인함수 기반의 위치 인코딩(positional encoding)에 의존하지만, 유한한 인코딩 크기로 인해 모델의 표현 능력이 제한된다. 단일 이미지 표현에서 대규모이고 다양한 데이터셋을 표현하기 위해서는 더 높은 표현 능력이 요구된다. 본 연구는 이미지를 다항함수로 표현함으로써 위치 인코딩의 필요성을 제거함으로써 이 격차를 해소한다. 이를 위해, 각 ReLU 계층 이후 특징량과 애파인 변환된 좌표 위치 간의 원소별 곱셈을 반복적으로 수행하여 점차 높은 차수의 다항 표현을 달성한다. 제안된 방법은 ImageNet과 같은 대규모 데이터셋을 대상으로 정성적 및 정량적으로 평가되었으며, 복소성 있는 컨볼루션, 정규화, 또는 자체 주의(self-attention) 계층 없이도 최첨단 생성 모델들과 경쟁 가능한 성능을 보였다. 또한 훨씬 적은 학습 가능 파라미터를 사용하면서도 높은 표현 능력을 제공함으로써, 복잡한 도메인에서 생성 모델링 작업에 대한 INR 모델의 광범위한 적용 가능성을 열어준다. 코드는 \url{https://github.com/Rajhans0/Poly_INR}에서 공개되어 있다.