
초록
대화 행위(Dialogue Act, DA)의 식별은 자연어 이해를 필요로 하는 다양한 응용 분야에서 발화의 의미를 결정하는 데 중요한 요소이다. 최근 반복 신경망(Recurrent Neural Network, RNN)을 활용한 연구들은 DA 분류 문제에 적용했을 때 유망한 결과를 보였다. 본 연구는 발화 표현을 위한 새로운 확률적 방법을 제안하고, 맥락 외에서의 DA 분류를 위한 RNN 문장 모델을 제시한다. 발화 표현은 특정 DA와 빈도적으로 연관된 키워드를 선택하여 생성된다. 제안된 확률적 표현 방법은 Switchboard DA 코퍼스에 적용되었으며, 동일한 기준 RNN 모델을 사용하여 사전 학습된 단어 임베딩과의 성능을 비교하였다. 그 결과, 확률적 방법은 전체 정확도 75.48%를 달성하였으며, 단어 임베딩 표현보다 1.8% 향상된 성능을 보였다. 이는 단어와 DA 간의 관계를 포착할 수 있는 통계적 발화 표현이 DA 분류에 있어 잠재적인 유용성을 지닌다는 것을 시사한다.