HyperAIHyperAI

Command Palette

Search for a command to run...

Ein großes Korpus für die Entwirrung von Konversationen

Jonathan K. Kummerfeld Sai R. Gouravajhala Joseph J. Peper Vignesh Athreya Chulaka Gunasekara Jatin Gahotra Siva Sankalp Patel Lazaros Polymenakos Walter S. Lasecki

Zusammenfassung

Das Aufspalten von miteinander vermischten Konversationen in einem einzelnen Nachrichtenstrom ist eine schwierige Aufgabe, die durch den Mangel an umfangreichen manuell annotierten Datensätzen weiter erschwert wird. Wir haben einen neuen Datensatz mit 77.563 manuell annotierten Nachrichten erstellt, die mit Antwortstrukturgraphen versehen sind, die sowohl Konversationen aufspalten als auch deren interne Struktur definieren. Unser Datensatz ist 16-mal größer als alle bisher veröffentlichten Datensätze zusammen und der erste, der die Schlichtung von Annotierungsstreitigkeiten (adjudication of annotation disagreements) sowie Kontext beinhaltet. Mit Hilfe unserer Daten haben wir frühere Arbeiten neu überprüft und festgestellt, dass 80 % der Konversationen in einem weit verbreiteten Dialogkorpus entweder Nachrichten fehlen oder zusätzliche Nachrichten enthalten. Unsere manuell annotierten Daten bieten die Möglichkeit, robuste datengestützte Methoden für das Aufspalten von Konversationen zu entwickeln, was den Fortschritt der Dialogforschung fördern wird.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp