11일 전

신경망 대화 구문 분석기의 힘을 해방하다 — 대규모 사전학습을 활용한 컨텍스트 및 구조 인지 접근법

Grigorii Guz, Patrick Huber, Giuseppe Carenini
신경망 대화 구문 분석기의 힘을 해방하다 — 대규모 사전학습을 활용한 컨텍스트 및 구조 인지 접근법
초록

RST 기반의 논의 구조 분석은 요약, 기계 번역, 의견 탐사 등 다양한 후속 응용이 가능한 중요한 자연어 처리(NLP) 과제이다. 본 연구에서는 최신의 문맥 기반 언어 모델을 통합한 간단하면서도 매우 높은 정확도를 보이는 논의 구조 분석기(의사결정 분석기)를 제안한다. 제안한 분석기는 RST-DT 및 Instr-DT라는 두 가지 주요 RST 데이터셋에서 구조와 핵심성(nuclearity) 예측에 있어 새로운 최고 성능(SOTA)을 달성하였다. 또한, 최근 공개된 대규모 '은 표준(silver-standard)' 논의 트리뱅크인 MEGA-DT에서 사전 학습을 수행함으로써 더 큰 성능 향상을 달성할 수 있음을 입증하였으며, 이는 논의 분석 분야에서 새로운 그리고 유망한 연구 방향을 제시한다.

신경망 대화 구문 분석기의 힘을 해방하다 — 대규모 사전학습을 활용한 컨텍스트 및 구조 인지 접근법 | 최신 연구 논문 | HyperAI초신경