17일 전

시각적으로 풍부한 문서에서 엔티티 관계 추출을 의존 구문 분석으로 수행하기

Yue Zhang, Bo Zhang, Rui Wang, Junjie Cao, Chen Li, Zuyi Bao
시각적으로 풍부한 문서에서 엔티티 관계 추출을 의존 구문 분석으로 수행하기
초록

시각적으로 풍부한 문서(Visual Rich Documents, VRDs)에서 핵심 정보를 추출하기 위한 기존 연구들은 주로 각 경계 박스 내부의 텍스트(즉, 의미적 엔티티)에 레이블을 붙이는 데 초점을 맞추었으며, 엔티티 간의 관계는 거의 탐색되지 않았다. 본 논문에서는 이러한 엔티티 관계 추출 작업에 인기 있는 의존성 파싱 모델인 바이아핀(parser)을 적응시켰다. 기존의 의존성 파싱 모델이 단어 간의 의존 관계를 인식하는 것과 달리, 본 연구에서는 레이아웃 정보를 활용하여 단어 그룹 간의 관계를 식별한다. 다양한 의미적 엔티티 표현 방식, 다양한 VRD 인코더, 그리고 다양한 관계 디코더를 비교한 결과, 제안하는 모델이 FUNSD 데이터셋에서 65.96%의 F1 스코어를 달성함을 확인하였다. 실제 산업 응용 측면에서 본 모델은 내부 관세 데이터에 적용되어 생산 환경에서도 신뢰할 수 있는 성능을 발휘하였다.