11일 전

지원 벡터 기계 분류를 기반으로 한 새로운 담론 구문 분석기

{Helmut Prendinger, David duVerle}
지원 벡터 기계 분류를 기반으로 한 새로운 담론 구문 분석기
초록

이 논문은 문맥 구조 이론(Rhetorical Structure Theory, RST)의 틀 안에서 대화구조를 해석하는 새로운 알고리즘을 제안한다. 본 연구의 방법은 최근 통계적 기계학습 분야의 발전(지지 벡터 기계의 다변량 처리 능력)과 풍부한 특징 공간을 기반으로 하고 있다. RST는 대화구조 분석 및 텍스트 생성 등에 강력한 응용성을 지닌 계층적 텍스트 조직을 위한 공식적 틀을 제공한다. 본 연구에서는 입력 텍스트에 대해 RST 기반의 계층적 관계를 자동으로 주석화하는 방법을 제시하며, 그 결과는 전문적으로 훈련된 인간 주석자들과 비교해도 유사한 수준임을 입증한다. 입력 텍스트로부터 추출한 다양한 얕은 어휘적, 문법적, 구조적 특징들을 활용하여, 본 해석기는 선형 시간 내에 전문 주석자들의 인간 일치도(F-score)의 73.9%에 도달한다. 또한 현재 최고 수준의 해석기들과 비교하여 5%에서 12% 더 높은 정확도를 보였다.

지원 벡터 기계 분류를 기반으로 한 새로운 담론 구문 분석기 | 최신 연구 논문 | HyperAI초신경