9일 전

관계 추출을 위한 레이블 증강을 통한 시퀀스 생성

Bo Li, Dingyao Yu, Wei Ye, Jinglei Zhang, Shikun Zhang
관계 추출을 위한 레이블 증강을 통한 시퀀스 생성
초록

최근 정보 추출 연구에서 시퀀스 생성 기법은 대규모 사전 훈련된 Seq2Seq 모델을 활용함으로써 희망적인 성능을 보여주고 있다. 본 논문은 관계 추출(Relation Extraction, RE)에 시퀀스 생성 기법을 적용할 때의 장점을 탐구하며, 관계 이름 또는 동의어를 생성 대상으로 삼을 경우, 이들의 텍스트적 의미와 단어 시퀀스 패턴 상의 상관관계가 모델 성능에 영향을 미친다는 점을 발견하였다. 이를 바탕으로 본 연구는 관계 이름에 대해 의미적으로 유사한 표현을 자동으로 증강하여 생성 대상으로 활용하는 '라벨 증강을 통한 관계 추출(Relation Extraction with Label Augmentation, RELA)'이라는 Seq2Seq 모델을 제안한다. 여기서 '라벨 증강'이란 각 관계 이름에 대해 의미상 동의어를 생성 대상으로 추가하는 것을 의미한다. 또한, Seq2Seq 모델이 관계 추출 작업을 수행할 때의 동작 특성을 심층적으로 분석하였다. 실험 결과, RELA는 네 가지 관계 추출 데이터셋에서 기존 방법들과 비교하여 경쟁적인 성능을 달성하였다.

관계 추출을 위한 레이블 증강을 통한 시퀀스 생성 | 최신 연구 논문 | HyperAI초신경