4달 전

강화학습을 활용한 담화 마커 증강 네트워크 для 자연어 추론

Boyuan Pan; Yazheng Yang; Zhou Zhao; Yueting Zhuang; Deng Cai; Xiaofei He
강화학습을 활용한 담화 마커 증강 네트워크 для 자연어 추론
초록

자연어 추론(Natural Language Inference, NLI) 또는 텍스트 함의 인식(Recognizing Textual Entailment, RTE)은 자연어 처리 분야에서 가장 중요한 문제 중 하나입니다. 이는 두 문장 간의 논리적 관계를 추론하는 것을 요구합니다. 현재 접근 방식들은 주로 문장들의 상호작용 구조에 초점을 맞추고 있지만, 본 논문에서는 중요한 담화 마커(discourse markers)로부터 지식을 전이하여 NLI 모델의 품질을 개선하는 방법을 제안합니다. 우리는 사람들이 일반적으로 'so'나 'but'과 같은 담화 마커를 사용하여 두 문장 간의 논리적 관계를 표현함을 관찰하였습니다. 이러한 단어들은 문장의 의미와 깊은 연관성이 있으므로, 이를 활용하여 문장의 표현을 개선하는 데 도움이 될 수 있습니다. 또한, NLI 데이터셋의 특성을 기반으로 정의된 보상(reward)을 사용하여 새로운 목적 함수(objective function)를 최적화하기 위해 강화 학습(reinforcement learning)을 활용하였습니다. 실험 결과, 우리의 방법은 여러 대규모 데이터셋에서 최신 성능(state-of-the-art performance)을 달성하였습니다.