2달 전
CRF-Attentive Structured Network을 통한 대화 행위 인식
Zheqian Chen; Rongqin Yang; Zhou Zhao; Deng Cai; Xiaofei He

초록
대화 행위 인식(DAR)은 대화 해석에서 어려운 문제로, 발화에 의미적 라벨을 부착하고 화자의 의도를 특성화하는 것을 목표로 합니다. 현재 많은 기존 접근 방식들은 다중 분류부터 구조적 예측까지 다양한 형태로 DAR 문제를 정식화하고 있으며, 이들 접근 방식은 수작업으로 만든 특징 확장과 주의 깊은 문맥 구조적 종속성을 갖는다는 단점이 있습니다. 본 논문에서는 end-to-end 학습을 포기하지 않은 채 더 풍부한 조건부 확률 모델(CRF: Conditional Random Field) 구조적 종속성을 확장하는 관점에서 DAR 문제를 고려합니다. 우리는 발화 모델링에 계층적 의미 추론과 메모리 메커니즘을 통합하였습니다. 그런 다음, 문맥 발화와 해당 대화 행위를 모두 고려하는 선형 체인 조건부 확률 모델 계층으로 구조적 주의 네트워크를 확장하였습니다. 두 주요 벤치마크 데이터셋인 스위치보드 대화 행위(SWDA: Switchboard Dialogue Act) 데이터셋과 미팅 레코더 대화 행위(MRDA: Meeting Recorder Dialogue Act) 데이터셋을 사용한 광범위한 실험 결과, 우리의 방법이 다른 최신 해결책보다 우수한 성능을 보임을 확인할 수 있었습니다. 특히, SWDA에서 인간 주석자와의 성능 차이가 2% 미만이라는 점은 주목할 만한 사실입니다.