FInC 플로우: 정규화 플로우를 위한 빠르고 역행 가능한 $k \times k$ 컨볼루션

역행 가능(convolution)은 Glow에서 도입된 이후, 표현력이 풍부한 정규화 흐름 기반 생성 모델을 구축하는 데 핵심적인 요소로 자리 잡았다. 훈련 및 샘플링 과정에서 효율적인 역행 가능 $k \times k$ 컨볼루션을 설계하기 위한 여러 시도가 이루어졌다. 이러한 시도들은 표현력과 샘플링 효율성을 개선했지만, 여전히 단순한 $1 \times 1$ 컨볼루션만을 사용한 Glow에 비해 샘플링 시간 측면에서 크게 뒤처져 있었다. 게다가 많은 접근 방식은 기반 컨볼루션의 많은 파라미터를 마스킹함으로써 고정된 실행 시간 예산 내에서 표현력이 낮아지는 문제가 있었다. 본 논문에서는 i.) 입력 이미지의 높이와 너비를 각각 $n$으로, 커널 크기를 $k$로 했을 때, 실행 시간이 O$(n k^2)$인 고속 병렬 역행 알고리즘을 갖춘 $k \times k$ 컨볼루션 계층과, ii.) 계층 내에서 학습 가능한 파라미터 중 최소한만을 마스킹하는, iii.) 실제 벤치마크에서 다른 $k \times k$ 컨볼루션 기반 모델과 비슷한 전방 전파 및 샘플링 시간을 제공하는 딥 정규화 흐름(Deep Normalizing Flow) 아키텍처를 제안한다. 또한, GPU 기반으로 제안된 역행 가능 컨볼루션을 활용한 병렬 샘플링 알고리즘의 구현을 제공한다. CIFAR-10, ImageNet, CelebA 데이터셋에 대한 벤치마크 결과는, 비트당 차원 수(bits per dimension) 측면에서 기존 연구들과 유사한 성능을 보이며, 동시에 샘플링 시간을 크게 향상시켰음을 입증한다.