
최근의 생성적 적대 신경망(GAN)은 대규모 학습을 통해 뛰어난 성과를 달성하고 있으며, 수백만 개의 파라미터를 포함하는 복잡한 모델을 활용함으로써 광범위한 계산 능력을 요구한다. 이러한 거대한 모델을 구축하는 과정은 모델의 재현 가능성(reproducibility)을 저해하고 학습의 불안정성을 증가시키는 문제를 야기한다. 또한, 이미지나 오디오와 같은 다중 채널 데이터는 일반적으로 실수 기반의 컨볼루션 신경망을 통해 입력을 평탄화하고 연결(concatenate)하여 처리하는데, 이 과정에서 채널 내부의 공간적 관계가 상실되는 경우가 많다. 이러한 복잡성과 정보 손실 문제를 해결하기 위해, 본 연구에서는 퀘이터니언 기반 생성적 적대 신경망(QGAN)의 일련의 모델을 제안한다. QGAN은 퀘이터니언 대수의 특성, 예를 들어 해밀턴 곱(Hamilton product)을 활용하여 채널을 하나의 단일 실체로 처리함으로써 내부의 잠재적 관계를 효과적으로 포착할 수 있으며, 전체 파라미터 수를 4배 줄일 수 있다. 본 연구에서는 QGAN의 설계 방법을 제시하고, 제안된 접근법을 고도화된 모델로까지 확장하는 방법을 설명한다. 여러 이미지 생성 벤치마크에서 제안된 QGAN과 실수 기반 GAN을 비교 분석한 결과, QGAN은 실수 기반 GAN보다 더 낮은 FID 점수를 기록하며 시각적으로 매력적인 이미지를 생성함을 확인하였다. 또한, QGAN은 학습 시 필요한 파라미터 수를 최대 75%까지 절감할 수 있다. 이러한 결과는 성능 향상과 계산 자원 절약을 동시에 달성할 수 있는 새로운 접근 방식을 제시하며, 더 접근성 있고 효율적인 GAN 기술의 발전을 이끌 수 있을 것으로 기대된다.