17일 전

다중 에이전트 듀얼 학습

{Tie-Yan Liu, ChengXiang Zhai, Fei Tian, Yiren Wang, Tianyu He, Tao Qin, Yingce Xia}
다중 에이전트 듀얼 학습
초록

이중 학습(dual learning)은 머신러닝, 컴퓨터 비전, 자연어 처리 분야에서 큰 주목을 받고 있다. 이중 학습의 핵심 아이디어는 도메인 X에서 도메인 Y로의 변환을 수행하는 원시 작업(primal task)과 그 역방향인 도메인 Y에서 도메인 X로의 변환을 수행하는 이중 작업(dual task) 간의 이중성(duality)을 활용하여 두 작업의 성능을 동시에 향상시키는 데 있다. 기존의 이중 학습 프레임워크는 이러한 이중성을 활용하기 위해 두 개의 에이전트(원시 모델과 이중 모델)로 구성된 시스템을 사용한다. 본 논문에서는 이를 확장하여 다수의 원시 모델과 이중 모델을 도입하고, 다에이전트 이중 학습 프레임워크(multi-agent dual learning framework)를 제안한다. 신경망 기반 기계 번역과 이미지 변환 작업에서 수행한 실험을 통해 제안한 프레임워크의 효과성을 입증하였다. 특히, IWSLT 2014 독일어-영어 번역에서 35.44의 BLEU 점수로 새 기록을 수립하였으며, WMT 2014 영어-독일어 번역에서는 강력한 Transformer 기반 베이스라인 대비 2.6 이상의 BLEU 점수 향상(31.03 BLEU)을 달성하였다. 또한 최근 WMT 2018 영어-독일어 번역에서는 49.61의 BLEU 점수를 기록하며 새로운 최고 기록을 수립하였다.

다중 에이전트 듀얼 학습 | 최신 연구 논문 | HyperAI초신경