
要約
生成対抗ネットワーク(GAN)は、現実的な画像の生成において大きな成功を収めてきた。しかし、現代のGANアーキテクチャにおいては、テキスト生成は依然として困難な課題のままである。本研究では、テキスト生成を目的とした新しいGANアーキテクチャであるRelGANを提案する。RelGANは、以下の3つの主要な構成要素から構成される:長距離依存関係のモデリングに向けた関係記憶ベースの生成器、離散データ上でGANを訓練するためのGumbel-Softmaxリラクセーション、および生成器の更新により情報豊かな信号を提供するための複数の埋め込み表現を備えた識別器。実験の結果、RelGANはサンプルの品質および多様性という観点で、現在の最先端モデルを上回ることを示した。さらに、アブレーションスタディにより、RelGANの各構成要素が性能向上に不可欠な役割を果たしていることが明らかになった。また、本手法の重要な利点として、単一の調整可能なパラメータを用いることで、サンプルの品質と多様性のトレードオフを制御できる点が挙げられ、これにより他のGANと明確に差別化される。最後に、RelGANは、Gumbel-Softmaxリラクセーションを用いたGANが現実的なテキストを生成することに成功した初のアーキテクチャである。