11일 전
과학문서에서의 공동 엔티티 및 관계 추출: 언어 정보와 엔티티 유형의 역할
{Partha Pratim Das, Debarshi Kumar Sanyal, Sudakshina Dutta, Prantika Chakraborty, T Y S S Santosh}

초록
과학 논문은 다양한 도메인 특화된 엔티티와 그 사이의 관계를 포함하고 있다. 이러한 엔티티와 관계는 문서의 주제에 대한 핵심 정보를 간결하게 요약하므로, 문서의 이해 및 자동 분석에 있어 매우 중요하다. 본 논문에서는 깊은 신경망 모델을 활용하여 과학적 초록에서 엔티티와 관계를 자동으로 추출하는 것을 목표로 한다. 입력 문장이 주어지면, 사전 훈련된 트랜스포머를 사용하여 토큰들의 문맥적 임베딩을 생성하고, 이를 품사 태그(POS)의 임베딩으로 보완한다. 보완된 토큰 표현들의 시퀀스는 스팬을 형성하며, 엔티티와 관계는 이 스팬들 위에서 공동으로 학습된다. 엔티티 분류기에서 예측한 엔티티 로짓은 관계 분류기의 특징으로 사용된다. 제안하는 모델은 SciERC 및 ADE 데이터셋에서 기존의 경쟁적 기준 모델들에 비해 엔티티 및 관계 추출 성능에서 향상된 결과를 보였다.