8일 전

영상 구분자용 저차원 커널

Emmanuel Kahembwe, Subramanian Ramamoorthy
영상 구분자용 저차원 커널
초록

이 연구에서는 동영상에 적용되는 생성적 적대 신경망(GAN)의 판별기(discriminator)에 대한 분석을 제시한다. 우리는 제약 없이 설계된 동영상 판별기 아키텍처가 높은 곡률을 가진 손실 표면(loss surface)을 유도함으로써 최적화를 어렵게 한다는 점을 보여준다. 또한, 동영상 판별기의 최대 커널 차원이 증가할수록 이러한 곡률이 더욱 극단적으로 나타난다는 점을 입증한다. 이러한 관찰을 바탕으로, GAN을 위한 효율적인 저차원 동영상 판별기(LDVD GANs)의 일련의 아키텍처를 제안한다. 제안된 판별기 가족은 적용된 동영상 GAN 모델의 성능을 향상시키며, UCF-101과 같이 복잡하고 다양한 데이터셋에서도 우수한 성능을 보여준다. 특히, 이들 판별기가 시간적 GAN(Temporal-GAN)의 성능을 두 배로 향상시킬 수 있음을 보이며, 단일 GPU 환경에서도 최신 기술 수준의 성능을 달성할 수 있음을 입증한다.

영상 구분자용 저차원 커널 | 최신 연구 논문 | HyperAI초신경