2달 전

과학 지식 그래프 구축을 위한 다중 작업 실체, 관계, 및 공유 참조 식별

Yi Luan; Luheng He; Mari Ostendorf; Hannaneh Hajishirzi
과학 지식 그래프 구축을 위한 다중 작업 실체, 관계, 및 공유 참조 식별
초록

과학 논문에서 실체 식별, 관계 분류, 공유 참조 군집을 식별하고 분류하는 다중 작업 설정을 소개합니다. 우리는 이 세 가지 작업에 대한 주석을 포함하는 데이터셋인 SciERC를 생성하고, 공유 스팬 표현(shared span representations)을 사용하는 통합 프레임워크인 과학 정보 추출기(Scientific Information Extractor, SciIE)를 개발했습니다. 다중 작업 설정은 작업 간의 연쇄 오류(cascading errors)를 줄이고 공유 참조 링크(coreference links)를 통해 문장 간 관계(cross-sentence relations)를 활용합니다. 실험 결과, 우리의 다중 작업 모델은 도메인 특화 기능(domain-specific features)을 사용하지 않음에도 불구하고 과학 정보 추출에서 이전 모델들을 능가함을 보였습니다. 또한 이 프레임워크가 과학 지식 그래프(scientific knowledge graph) 구축을 지원하며, 이를 통해 과학 문헌 내의 정보를 분석할 수 있음을 입증하였습니다.

과학 지식 그래프 구축을 위한 다중 작업 실체, 관계, 및 공유 참조 식별 | 최신 연구 논문 | HyperAI초신경