11일 전

다양한 도메인의 연구 논문에서의 공명 해결

Arthur Brack, Daniel Uwe Müller, Anett Hoppe, Ralph Ewerth
다양한 도메인의 연구 논문에서의 공명 해결
초록

공명 해결(coreference resolution)는 텍스트 요약이나 질의응답과 같은 고수준 정보 검색 작업을 지원하기 위해 자동 텍스트 이해에 필수적인 요소이다. 기존 연구에 따르면, 최신 기술(예: BERT 기반)의 성능은 과학 논문에 적용될 경우 명백히 저하된다. 본 논문에서는 연구 논문 내에서의 공명 해결 작업과 이후 지식 그래프(KG) 구축을 탐구한다. 다음과 같은 기여를 제시한다: (1) 과학, 기술, 의학(STM) 분야의 10개 서로 다른 학문 분야에서 구성된 공명 해결을 위한 어노테이션 코퍼스를 구축하였다; (2) 연구 논문에서의 자동 공명 해결을 위한 전이 학습(transfer learning) 기법을 제안하였다; (3) 공명 해결이 지식 그래프 구축에 미치는 영향을 분석하였다; (4) 10개 STM 분야의 55,485편의 논문에서 자동으로 구축된 연구용 지식 그래프를 공개하였다. 포괄적인 실험을 통해 제안된 접근 방식의 유용성을 입증하였다. 제안한 전이 학습 방법은 본 연구에서 제시한 코퍼스에서 최신 기준 대비 F1 점수 61.4(+11.0)로 상당히 우수한 성능을 보였으며, 골드 표준 지식 그래프를 기준으로 한 평가에서는 공명 해결이 구축된 지식 그래프의 품질을 크게 향상시켜 F1 점수 63.5(+21.8)를 기록하였다.

다양한 도메인의 연구 논문에서의 공명 해결 | 최신 연구 논문 | HyperAI초신경