Command Palette
Search for a command to run...
{Eugene Charniak Micha Elsner}

초록
다수의 대화가 동시에 발생할 경우, 청취자는 각 발화가 어떤 대화의 일부인지 판단하여 적절하게 해석하고 응답해야 한다. 이 작업을 우리는 '분리(Disentanglement)'라고 한다. 본 연구에서는 인터넷 릴레이 채팅(Internet Relay Chat, IRC) 대화 데이터를 수작업으로 분리한 코퍼스를 제시하고, 평가자 간 일관성(annotator reliability)을 분석한다. 이는 우리가 알고 있는 바에 따르면 인터넷 채팅을 대상으로 한 최초의 이러한 코퍼스이다. 또한, 이전에 이 작업에 적용된 바 없는 대화 기반 특징(디스커스 기반 특징)을 사용한 그래프 이론적 모델을 제안한다. 제안한 모델이 예측한 분리 결과는 수작업 분석 결과와 높은 상관관계를 보였다.
벤치마크
| 벤치마크 | 방법론 | 지표 |
|---|---|---|
| conversation-disentanglement-on-irc | Linear | 1-1: 51.4 F: 15.5 P: 12.1 R: 21.5 VI: 82.1 |
| conversation-disentanglement-on-linux-irc-ch2 | Linear | 1-1: 59.7 Local: 80.8 Shen F-1: 63.0 |
| conversation-disentanglement-on-linux-irc-ch2-1 | Linear | 1-1: 53.1 Local: 81.9 Shen F-1: 55.1 |