11일 전

TDEER: 실체 및 관계 동시 추출을 위한 효율적인 번역 디코딩 스키마

{Zhen He, Beidi Luan, Daichuan Yang, Chenghao Dong, Xiaotian Luo, Xianming Li}
TDEER: 실체 및 관계 동시 추출을 위한 효율적인 번역 디코딩 스키마
초록

구조화되지 않은 텍스트로부터 엔티티와 관계를 공동 추출하여 사실적 삼항조(factual triples)를 구성하는 것은 지식 기반(Knowledge Base, KB) 구축의 핵심 과제이다. 일반적으로는 엔티티 쌍을 예측함으로써 해당 관계를 도출하는 방식으로 삼항조를 디코딩한다. 그러나 특히 중첩된 삼항조(overlapping triples) 문제를 효과적으로 다루는 것은 여전히 도전 과제이다. 이러한 문제를 해결하기 위해 본 논문은 새로운 효율적인 엔티티 및 관계 추출 모델인 TDEER(Translating Decoding Schema for Joint Extraction of Entities and Relations)를 제안한다. 기존의 접근 방식과 달리, 제안하는 번역 디코딩 스키마(Translating Decoding Schema)는 관계를 주어진 주어(subject)에서 목적어(object)로의 변환 연산으로 간주한다. 즉, TDEER는 삼항조를 주어 + 관계 → 목적어의 형태로 디코딩한다. 이 방식은 중첩된 삼항조와 비중첩된 삼항조를 포함하여 가능한 모든 삼항조를 인식할 수 있기 때문에, 자연스럽게 중첩 삼항조 문제를 해결할 수 있다. 모델의 안정성을 강화하기 위해, 다양한 단계에서 발생할 수 있는 오류 누적 문제를 완화하기 위해 부정 샘플(negative samples)을 도입하였다. 공개 데이터셋을 대상으로 수행한 광범위한 실험 결과, TDEER는 최첨단(SOTA) 기준 모델들과 경쟁 가능한 성능을 보였다. 또한, 계산 복잡도 분석 결과 TDEER는 강력한 기존 기준 모델들보다 더 효율적임이 입증되었으며, 특히 최근의 최첨단 모델들보다 약 2배 빠른 속도를 기록하였다. 코드는 https://github.com/4AI/TDEER 에서 공개되어 있다.

TDEER: 실체 및 관계 동시 추출을 위한 효율적인 번역 디코딩 스키마 | 최신 연구 논문 | HyperAI초신경