
초록
우리는 원래의 의도를 유지하면서 표면 형태를 다르게 하는 영어 질문의 동의어 문장을 생성하는 방법을 제안한다. 본 연구의 모델은 정교한 학습 목적 함수와 체계적인 정보 차단 원칙을 결합하여 의미와 형태를 분리한 잠재적 인코딩 공간을 유도한다. 우리는 동일한 의미를 가진 질문을 동의어 문장으로부터 재구성하고, 동일한 표면 형태를 가진 예시를 사용하여 인코더-디코더 모델을 학습함으로써, 의미와 형태가 분리된 인코딩 공간을 구축한다. 표면 형태를 이산적인 잠재 변수의 집합으로 표현하기 위해 벡터 양자화 변분 오토인코더(VQ-VAE)를 사용함으로써, 테스트 시기에 분류기(classifier)를 활용해 다른 표면 형태를 선택할 수 있다. 핵심적으로, 본 방법은 외부의 타겟 예시 소스에 접근할 필요가 없다. 광범위한 실험과 인공지능 평가 결과를 통해, 기존 방법들에 비해 의미 보존과 문법적 신선성 사이의 균형을 더 우수하게 달성함을 확인하였다.