18일 전

위치 인지형 어텐션과 감독 데이터가 슬롯 채우기 성능을 향상시킨다

{Victor Zhong, Gabor Angeli, Danqi Chen, Yuhao Zhang, Christopher D. Manning}
위치 인지형 어텐션과 감독 데이터가 슬롯 채우기 성능을 향상시킨다
초록

관계 지식을 구조화된 형태인 '지식 그래프'로 정리하는 것은 다양한 응용 분야에서 매우 중요하다. 그러나 문서에서 자동으로 추출된 사실을 지식 기반에 채우는 능력은 여전히 매우 느리게 발전하고 있다. 본 논문은 이전 연구의 발전을 저해해온 두 가지 문제를 동시에 해결한다. 먼저, 관계 추출에 더 적합한 엔티티 위치 인지 주의(attention) 방식을 포함한 LSTM 시퀀스 모델을 효과적으로 제안한다. 그 후, TAC KBP 관계를 대상으로 하여 커뮤니티 기반의 크라우드소싱 방식을 통해 수집한 대규모(119,474개 예시)의 감독형 관계 추출 데이터셋인 TACRED을 구축한다. 보다 우수한 감독 데이터와 더 높은 표현력이 가능한 모델의 조합은 관계 추출 성능을 크게 향상시킨다. 이 새로운 데이터셋으로 학습된 모델이 기존 TAC KBP 2015 슬롯 채우기 시스템의 관계 추출 모듈로 대체될 경우, F1 점수는 22.2%에서 26.7%로 현저히 향상된다.