2달 전
대화 행위 시퀀스 라벨링을 위한 계층적 인코더와 CRF의 활용
Harshit Kumar; Arvind Agarwal; Riddhiman Dasgupta; Sachindra Joshi; Arun Kumar

초록
대화 행위 인식은 대화에서 발화(utterance)에 대화 행위(즉, 의미적 라벨)를 연결하는 작업입니다. 발화에 의미적 라벨을 부여하는 문제는 시퀀스 라벨링 문제로 다룰 수 있습니다. 본 연구에서는 양방향 LSTM을 기본 단위로 사용하고 조건부 확률 모델(CRF)을 최상위 계층으로 하는 계층적 순환 신경망을 구축하여 각 발화를 해당 대화 행위로 분류합니다. 이 계층적 네트워크는 단어 수준, 발화 수준, 그리고 대화 수준의 여러 단계에서 표현을 학습합니다. 대화 수준의 표현은 모든 이전 발화뿐만 아니라 그들의 대화 행위도 고려하는 CRF 계층의 입력으로 사용되므로, 라벨과 발화 간의 의존성을 모델링하는데 중요한 역할을 합니다. 자연스러운 대화에서 이러한 의존성을 고려하는 것이 중요합니다. 우리는 Switchboard와 Meeting Recorder Dialogue Act라는 두 가지 다른 벤치마크 데이터 세트를 통해 접근 방식을 검증하였으며, 각각 기존 최신 방법보다 절대적으로 $2.2\%$와 $4.1\%$의 성능 향상을 보였습니다. 특히 Switchboard 데이터 세트의 주석자 간 일치도가 $84\%$인 반면, 노이즈가 있는 데이터로 훈련되었음에도 불구하고 우리의 방법은 약 $79\%$의 정확도를 달성하였습니다.