2달 전

문서 수준 관계 추출을 위한 시퀀스-투-시퀀스 접근법

John Giorgi; Gary D. Bader; Bo Wang
문서 수준 관계 추출을 위한 시퀀스-투-시퀀스 접근법
초록

다양한 관계가 문장 경계를 넘는다는 사실에 동기를 부여받아, 문서 수준의 관계 추출(DocRE)에 대한 관심이 점차 증가하고 있습니다. DocRE는 문장 내외에서 정보를 통합하고, 개체 언급 간의 복잡한 상호작용을 포착하는 것이 필요합니다. 기존의 대부분 방법은 파이프라인 방식으로, 개체를 입력으로 요구합니다. 그러나 개체와 관계 추출을 공동으로 학습하면 공유된 매개변수와 훈련 단계로 인해 성능이 향상되고 효율성이 높아질 수 있습니다. 본 논문에서는 DocRE의 하위 작업(개체 추출, 공통 참조 해결, 관계 추출)을 end-to-end 방식으로 학습할 수 있는 시퀀스-투-시퀀스 접근법인 seq2rel을 개발하였습니다. 이는 작업별 구성 요소의 파이프라인을 대체합니다. 우리는 이를 '개체 힌팅'이라는 간단한 전략을 사용하여 여러 인기 있는 의생명 과학 데이터셋에서 기존 파이프라인 기반 방법과 비교하였으며, 일부 경우에서 그 성능을 초월하였습니다. 또한 이러한 데이터셋에 대한 최초의 end-to-end 결과를 보고하여 향후 비교 자료로 활용할 수 있도록 하였습니다. 마지막으로, 우리의 모델 하에서 end-to-end 접근법이 파이프라인 기반 접근법보다 우수함을 입증하였습니다. 우리의 코드, 데이터 및 훈련된 모델은 {\url{https://github.com/johngiorgi/seq2rel}}에서 확인할 수 있으며, 온라인 데모는 {\url{https://share.streamlit.io/johngiorgi/seq2rel/main/demo.py}}에서 이용 가능합니다.

문서 수준 관계 추출을 위한 시퀀스-투-시퀀스 접근법 | 최신 연구 논문 | HyperAI초신경