NLP_HZ bei SemEval-2018 Aufgabe 9: Ein Ansatz basierend auf nächsten Nachbarn

Die Hyperonym-Entdeckung zielt darauf ab, Hyperonym-Wortmengen zu identifizieren, gegeben ein Hyponym-Wort und eine geeignete Korpus-Datenbasis. In diesem Artikel wird eine einfache, jedoch effektive Methode zur Entdeckung von Hyperonym-Mengen vorgestellt, die auf Wort-Embeddings basiert und zur Messung der kontextuellen Ähnlichkeit zwischen Wörtern verwendet werden kann. Gegeben ein Test-Hyponym-Wort ermitteln wir dessen Hyperonym-Listen, indem wir die Ähnlichkeiten zwischen dem Hyponym-Wort und den Wörtern im Trainingsdatensatz berechnen. Die Hyperonym-Liste des Test-Worts wird dann mit der Hyperonym-Liste aus dem Trainingsdatensatz gefüllt, die die geringste Ähnlichkeitsdistanz zum Test-Wort aufweist. In der SemEval 2018-Aufgabe 9 erzielten unsere Ergebnisse Platz 1 für Spanisch, Platz 2 für Italienisch und Platz 6 für Englisch im Metrikmaß MAP.