Command Palette
Search for a command to run...
{Eugene Charniak Micha Elsner}

要約
複数の会話が同時に進行する状況では、聞き手は各発話がどの会話に属するかを判断する必要があるため、適切に意味を理解し、応答を行うことができる。このタスクを我々は「分離(disentanglement)」と呼ぶ。本研究では、インターネット・リレーチャット(IRC)の対話データを用いたコーパスを提示し、その中でのさまざまな会話が手動で分離されている。また、アノテーター間の信頼性を評価した。このコーパスは、我々の知る限り、インターネットチャット用の最初のものである。さらに、従来このタスクに適用されたことのない、会話の文脈に基づく特徴を用いたグラフ理論的モデルを提案する。このモデルによる予測された分離結果は、手動によるアノテーションと高い相関を示している。
ベンチマーク
| ベンチマーク | 方法論 | 指標 |
|---|---|---|
| conversation-disentanglement-on-irc | Linear | 1-1: 51.4 F: 15.5 P: 12.1 R: 21.5 VI: 82.1 |
| conversation-disentanglement-on-linux-irc-ch2 | Linear | 1-1: 59.7 Local: 80.8 Shen F-1: 63.0 |
| conversation-disentanglement-on-linux-irc-ch2-1 | Linear | 1-1: 53.1 Local: 81.9 Shen F-1: 55.1 |