ADAPT bei SemEval-2018 Aufgabe 9: Skip-Gram-Wortembeddings für die unsupervisierte Hypernym-Entdeckung in spezialisierten Korpora

Diese Arbeit beschreibt ein einfaches, aber leistungsstarkes, unsupervisiertes System zur Entdeckung von Hyperny men. Das System nutzt Skip-gram-Wortembeddings mit Negative Sampling, die auf spezialisierten Korpora trainiert wurden. Kandidaten-Hypernymen für ein Eingabewort werden auf Basis von Kosinus-Ähnlichkeitswerten vorhergesagt. Zwei Sätze von Wortembeddings-Modellen wurden unabhängig voneinander auf zwei spezialisierten Korpora trainiert: einem medizinischen Korpus und einem Korpus der Musikindustrie. Unser System erzielte im medizinischen Bereich die höchste Bewertung unter den konkurrierenden unsupervisierten Systemen, zeigte jedoch eine schlechte Leistung im Bereich der Musikindustrie. Das System beruht ausschließlich auf rohen, spezialisierten Korpora und benötigt keine zusätzlichen externen Daten.