2달 전

의료 관계 추출을 위한 양방향 트리 태깅 방식

Xukun Luo; Weijie Liu; Meng Ma; Ping Wang
의료 관계 추출을 위한 양방향 트리 태깅 방식
초록

공동 의료 관계 추출은 단일 모델을 사용하여 의료 텍스트에서 엔티티와 관계로 구성된 트리플을 추출하는 것을 의미합니다. 이 문제의 하나의 해결 방안은 이 작업을 순차적 태깅 작업으로 변환하는 것입니다. 그러나 기존 연구에서는 트리플을 선형으로 표현하고 태깅하는 방법이 겹치는 트리플을 처리하지 못했으며, 그래프 형태로 트리플을 구성하는 방법은 큰 계산 비용에 직면했습니다. 본 논문에서는 의료 텍스트 내의 나무 구조와 유사한 관계 구조에 착안하여, Bidirectional Tree Tagging (BiTT)라는 새로운 방식을 제안합니다. BiTT 방식은 의료 관계 트리플을 두 개의 이진 트리로 형성하고, 이를 단어 수준의 태그 시퀀스로 변환합니다. BiTT 방식을 기반으로, 우리는 BiTT 태그를 예측하고 의료 트리플을 효율적으로 추출할 수 있는 공동 관계 추출 모델을 개발하였습니다. 우리의 모델은 두 개의 의료 데이터셋에서 F1 점수로 최고 베이스라인보다 각각 2.0%와 2.5% 높은 성능을 보였습니다. 또한, 다른 분야의 세 개 공개 데이터셋에서도 BiTT 방식을 적용한 모델들이 유망한 결과를 얻었습니다.

의료 관계 추출을 위한 양방향 트리 태깅 방식 | 최신 연구 논문 | HyperAI초신경