Sie reden mit mir? Ein Korpus und Algorithmus für die Entwirrung von Gesprächen

Wenn gleichzeitig mehrere Gespräche stattfinden, muss ein Zuhörer entscheiden, zu welchem Gespräch jede Äußerung gehört, um sie angemessen verstehen und darauf reagieren zu können. Wir bezeichnen diese Aufgabe als Entwirrung (disentanglement). Wir präsentieren eine Korpus-Datenbank von Internet Relay Chat (IRC)-Dialogen, in der die verschiedenen Gespräche manuell entwirrt wurden, sowie eine Evaluierung der Zuverlässigkeit der Annotationen. Nach unserem Wissen ist dies das erste derartige Korpus für Internet-Chats. Wir schlagen ein graphentheoretisches Modell zur Entwirrung vor, das diskursbasierte Merkmale nutzt, die bisher noch nicht für diese Aufgabe eingesetzt wurden. Die von dem Modell vorhergesagten Entwirrungen korrelieren stark mit den manuellen Annotationen.