
초록
생성적 적대 네트워크(GANs)는 데이터 합성을 위한 뛰어난 성공을 거두었습니다. 그러나 기존의 GANs는 판별자를 이진 분류기로 제한하여, 자연어 설명과 같은 풍부한 구조를 가진 출력을 생성해야 하는 작업에서 학습 능력이 제한됩니다. 본 논문에서는 고품질 언어 설명을 생성하기 위한 새로운 생성적 적대 네트워크인 RankGAN을 제안합니다. RankGAN은 개별 데이터 샘플에 절대적인 이진 판정을 배우고 할당하는 것이 아니라, 참조 그룹을 제공하여 인간이 작성한 문장과 기계가 작성한 문장을 분석하고 순위를 매길 수 있습니다. 데이터 샘플 집합을 전체적으로 보고 상대적인 순위 점수를 통해 그 품질을 평가함으로써, 판별자는 더 나은 평가를 수행할 수 있으며 이는 차례로 더 나은 생성기를 학습하는 데 도움이 됩니다. 제안된 RankGAN은 정책 그래디언트 기법을 통해 최적화됩니다. 여러 공개 데이터셋에 대한 실험 결과는 제안된 접근 방식의 효과성을 명확히 입증하였습니다.