
초록
관계 튜플은 두 개의 실체와 그 사이의 관계로 구성되며, 일반적으로 비구조화된 텍스트에서 발견된다. 한 텍스트 내에는 여러 개의 관계 튜플이 존재할 수 있으며, 이들 간에 하나 또는 둘 다 실체를 공유할 수 있다. 문장에서 이러한 관계 튜플을 추출하는 것은 어려운 과제이며, 튜플 간에 실체가 공유되거나 중복되는 경우 더욱 복잡해진다. 기존의 대부분의 연구들은 먼저 실체를 식별한 후, 그들 사이의 관계를 탐색하는 파이프라인 방식을 채택했으며, 이로 인해 문장 내 관계 튜플 간의 상호작용을 놓치는 문제가 있었다. 본 논문에서는 인코더-디코더 아키텍처를 활용하여 실체와 관계를 동시에 추출하는 두 가지 접근 방식을 제안한다. 첫 번째 방식은 디코더가 기계 번역 모델처럼 단어 단위로 출력할 수 있도록 하는 관계 튜플 표현 방식을 제안하며, 이는 길이가 다른 실체 이름을 포함하고 중복되는 실체를 가진 문장 내 모든 튜플을 정확히 탐지할 수 있도록 한다. 두 번째 방식은 포인터 네트워크 기반의 디코딩 접근 방식으로, 각 시간 단계에서 전체 튜플을 한 번에 생성한다. 공개된 뉴욕타임스 코퍼스를 대상으로 한 실험 결과, 제안하는 방법이 기존 연구를 상회하며 유의미하게 높은 F1 점수를 달성함을 보였다.