17일 전

OpenIE6: 개방형 정보 추출을 위한 반복적 그리드 레이블링 및 조인트 분석

Keshav Kolluru, Vaibhav Adlakha, Samarth Aggarwal, Mausam, Soumen Chakrabarti
OpenIE6: 개방형 정보 추출을 위한 반복적 그리드 레이블링 및 조인트 분석
초록

최근의 최신 신경망 기반 개방형 정보 추출(OpenIE) 시스템은 반복적으로 부분 출력을 인코딩하는 방식으로 추출을 수행하기 때문에 상당한 계산 비용이 발생한다. 반면, OpenIE에 대한 시퀀스 레이블링 접근법은 훨씬 빠르지만, 추출 품질 측면에서 열등하다. 본 논문에서는 반복적 레이블링 기반의 새로운 아키텍처를 제안함으로써 이 상충 관계를 극복한다. 제안하는 시스템은 기존의 최고 수준을 넘어선 성능을 달성하면서도, 기존 시스템 대비 10배 빠른 추출 속도를 제공한다. 이는 OpenIE를 2차원 그리드 레이블링 문제로 간주하는 새로운 '반복적 그리드 레이블링(Iterative Grid Labeling, IGL)' 아키텍처를 통해 달성된다. 또한 학습 과정에서 그리드에 커버리지(소프트) 제약을 도입함으로써 성능을 추가로 향상시켰다.또한, 최고의 OpenIE 시스템들이 연결 구조(coordination structures)를 처리하는 데 어려움을 겪는다는 점을 관찰한 결과, 본 연구는 동일한 IGL 아키텍처를 기반으로 한 새로운 연결 구조 분석기(coordination analyzer)를 도입하였다. 이 IGL 기반의 연결 구조 분석기는 복잡한 연결 구조를 효과적으로 처리할 수 있도록 도와주며, 기존 분석기 대비 F1 점수에서 12.3점 향상된 새로운 최고 성능을 기록하였다. 본 OpenIE 시스템인 OpenIE6는 이전 시스템 대비 최대 4점의 F1 점수 향상을 달성하면서도 훨씬 빠른 속도를 제공한다.