한 달 전

깊은 의미 역할 라벨링과 자기 주의 메커니즘

Zhixing Tan; Mingxuan Wang; Jun Xie; Yidong Chen; Xiaodong Shi
깊은 의미 역할 라벨링과 자기 주의 메커니즘
초록

의미 역할 라벨링(Semantic Role Labeling, SRL)은 자연어 이해를 향한 중요한 단계로 여겨져 왔으며, 이는 광범위하게 연구되어 왔습니다. 최근에는 순환 신경망(Recurrent Neural Networks, RNN)을 사용한 end-to-end SRL에 대한 관심이 증가하고 있습니다. 그러나 RNN이 구조적 정보와 장거리 의존성을 처리하는 것은 여전히 주요한 과제입니다. 본 논문에서는 이러한 문제들을 해결하기 위한 간단하면서도 효과적인 아키텍처를 제시합니다. 우리의 모델은 두 토큰 간의 관계를 거리와 상관없이 직접 포착할 수 있는 자기 주의(self-attention) 메커니즘을 기반으로 합니다. 우리의 단일 모델은 CoNLL-2005 공유 작업 데이터셋에서 F$_1=83.4$ 점수를, CoNLL-2012 공유 작업 데이터셋에서는 F$_1=82.7$ 점수를 달성하여 각각 이전 최신 연구 결과보다 1.8과 1.0 F$_1$ 점수를 개선하였습니다. 또한, 우리의 모델은 계산적으로 효율적이며, 단일 Titan X GPU에서 50K 토큰을 초당 파싱할 수 있습니다.

깊은 의미 역할 라벨링과 자기 주의 메커니즘 | 최신 연구 논문 | HyperAI초신경