19일 전

구문론적 다중 시각 학습을 통한 오픈 정보 추출

Kuicai Dong, Aixin Sun, Jung-Jae Kim, Xiaoli Li
구문론적 다중 시각 학습을 통한 오픈 정보 추출
초록

오픈 정보 추출(Open Information Extraction, OpenIE)은 개방형 도메인 문장에서 관계 튜플을 추출하는 것을 목표로 한다. 기존의 규칙 기반 또는 통계적 모델들은 문장의 문법 구조를 문법 분석기( syntactic parser)를 통해 식별한 후에 개발되어 왔다. 그러나 기존의 신경망 기반 OpenIE 모델들은 유용한 문법 정보를 충분히 탐색하지 못했다. 본 논문에서는 구성 구조(Constituency)와 의존 구조(Dependency) 트리를 모두 단어 수준의 그래프로 모델링하여, 신경망 기반 OpenIE가 문법 구조로부터 학습할 수 있도록 한다. 두 그래프에서 유도된 이질적인 정보를 효과적으로 융합하기 위해 다중 시각 학습(multi-view learning) 기법을 도입하여, 각 그래프로부터 다양한 관계를 포착한다. 마지막으로, 미세 조정된 구성 구조 및 의존 구조 표현을 문장의 의미 표현과 결합하여 튜플을 생성한다. 실험 결과, 구성 구조와 의존 구조 정보, 그리고 다중 시각 학습 기법이 모두 효과적임을 확인하였다.

구문론적 다중 시각 학습을 통한 오픈 정보 추출 | 연구 논문 | HyperAI초신경