
초록
생성적 적대 신경망(GAN)은 현실감 있는 이미지 생성에서 큰 성공을 거두었지만, 텍스트 생성은 여전히 현대 GAN 아키텍처에게 도전적인 과제로 남아 있다. 본 연구에서는 텍스트 생성을 위한 새로운 GAN 아키텍처인 RelGAN을 제안한다. RelGAN은 세 가지 주요 구성 요소로 구성된다: 장거리 의존성 모델링을 위한 관계 기억 기반 생성기, 이산 데이터 위에서 GAN을 훈련하기 위한 Gumbel-Softmax 완화 기법, 그리고 생성기 업데이트를 위한 더 풍부한 신호를 제공하기 위해 다수의 임베딩 표현을 사용하는 판별기이다. 실험 결과, RelGAN은 샘플의 품질과 다양성 측면에서 현재 최고 수준의 모델들을 모두 능가함을 보였다. 또한, 제거 실험(ablation study)를 통해 RelGAN의 각 구성 요소가 성능 향상에 핵심적인 기여를 한다는 점을 입증하였다. 더불어, 본 방법의 주요 장점 중 하나는 단일 조정 가능한 파라미터를 활용하여 샘플 품질과 다양성 사이의 트레이드오프를 제어할 수 있다는 점으로, 이는 다른 GAN들과의 주요 차별점이다. 마지막으로, RelGAN은 Gumbel-Softmax 완화 기법을 활용하여 현실적인 텍스트를 생성하는 데 성공한 최초의 아키텍처이다.