HyperAIHyperAI
vor 11 Tagen

CICERO: Ein Datensatz für kontextualisierte Alltagswissensinferenz in Dialogen

Deepanway Ghosal, Siqi Shen, Navonil Majumder, Rada Mihalcea, Soujanya Poria
CICERO: Ein Datensatz für kontextualisierte Alltagswissensinferenz in Dialogen
Abstract

Diese Arbeit behandelt das Problem der Dialogschlussfolgerung durch kontextualisierte Alltagswisseninferenz. Wir präsentieren CICERO, einen Datensatz dyadischer Gespräche, der fünf Arten von sprachlich auf Wortbeitrag-Ebene basierender Schlussfolgerungen enthält: Ursache, nachfolgendes Ereignis, Voraussetzung, Motivation und emotionale Reaktion. Der Datensatz umfasst 53.105 solcher Inferenzen aus insgesamt 5.672 Dialogen. Wir nutzen diesen Datensatz, um relevante generative und diskriminative Aufgaben zu lösen: die Generierung von Ursache und nachfolgendem Ereignis; die Generierung von Voraussetzungen, Motivationen sowie der emotionalen Reaktion des Zuhörers; sowie die Auswahl plausibler Alternativen. Unsere Ergebnisse belegen den Wert solcher auf Dialogen basierender Alltagswissensdatensätze. Wir hoffen, dass CICERO neue Forschungspfade in der auf Alltagswissen basierenden Dialogschlussfolgerung eröffnet.

CICERO: Ein Datensatz für kontextualisierte Alltagswissensinferenz in Dialogen | Neueste Forschungsarbeiten | HyperAI