HyperAIHyperAI
vor 2 Monaten

Zu einer besseren substitutionsbasierten Wortsinninduktion

Asaf Amrami; Yoav Goldberg
Zu einer besseren substitutionsbasierten Wortsinninduktion
Abstract

Die Wortsinndeduktion (Word Sense Induction, WSI) ist die Aufgabe der unüberwachten Clusterverteilung von Wortverwendungen innerhalb eines Satzes, um verschiedene Bedeutungen zu unterscheiden. Kürzliche Arbeiten erzielten starke Ergebnisse durch das Clustern lexikalischer Ersatzwörter, die aus vorab trainierten RNN-Sprachmodellen (ELMo) abgeleitet wurden. Die Anpassung dieser Methode an BERT verbessert die Scores noch weiter. Wir erweitern die bisherige Methode, um eine dynamische statt eine feste Anzahl von Clustern zu unterstützen, wie dies auch von anderen prominenten Methoden unterstützt wird, und schlagen eine Methode zur Interpretation der resultierenden Cluster vor, indem diese mit ihren informativsten Ersatzwörtern in Verbindung gebracht werden. Anschließend führen wir eine umfangreiche Fehleranalyse durch, die die verbleibenden Fehlerquellen bei der WSI-Aufgabe aufdeckt.Unser Code ist unter https://github.com/asafamr/bertwsi verfügbar.

Zu einer besseren substitutionsbasierten Wortsinninduktion | Neueste Forschungsarbeiten | HyperAI