Die Einbindung von Glossen in die neurale Wortsinnentfaltung

Die Wortsinndisambiguierung (WSD) hat das Ziel, die korrekte Bedeutung von Mehrdeutigkeitswörtern im jeweiligen Kontext zu identifizieren. Lexikalische Ressourcen wie WordNet haben sich als sehr hilfreich für WSD bei wissensbasierten Methoden erwiesen. Allerdings basieren bisherige neuronale Netze für WSD stets auf großen Mengen an annotierten Daten (Kontext), wobei lexikalische Ressourcen wie Glossare (Sinndefinitionen) vernachlässigt werden. In dieser Arbeit integrieren wir den Kontext und die Glossare des Zielworts in ein einheitliches Framework, um sowohl annotierte Daten als auch lexikalisches Wissen optimal zu nutzen. Daher schlagen wir GAS vor: ein glossenerweitertes neuronales Netzwerk für WSD, das den Kontext und die Glossare des Zielworts gemeinsam kodiert. GAS modelliert die semantische Beziehung zwischen dem Kontext und dem Glossar in einem verbesserten Memory-Network-Framework, was die Grenzen der bisherigen überwachten Methoden und wissensbasierten Methoden überwindet. Wir erweitern ferner das ursprüngliche Glossar der Wortbedeutungen durch ihre semantischen Beziehungen in WordNet, um die Informationen des Glossars zu bereichern. Die experimentellen Ergebnisse zeigen, dass unser Modell mehrere englische All-Words-WSD-Datensätze gegenüber den besten bisherigen Systemen übertrifft.