EXPR beim SemEval-2018 Task 9: Ein kombinierter Ansatz zur Hyperonym-Entdeckung

In diesem Paper präsentieren wir unser vorgeschlagenes System (EXPR), das am Hypernym-Entdeckungswettbewerb von SemEval 2018 teilnimmt. Die Aufgabe befasst sich mit der Herausforderung, Hypernym-Beziehungen aus einem Textkorpus zu identifizieren. Unser Ansatz kombiniert eine pfadbasierte Methode mit einer verteilungsorientierten Technik. Wir wenden einen Abhängigkeitsparser auf einen Korpus an, um Kandidaten für Hypernymen zu extrahieren, und repräsentieren deren Abhängigkeitspfade als Merkmalsvektor. Dieser Merkmalsvektor wird mit einem weiteren Merkmalsvektor kombiniert, der mithilfe eines auf Wikipedia vortrainierten Term-Embedding-Modells gewonnen wurde. Der zusammengesetzte Merkmalsvektor dient als Eingabe für ein überwachtes maschinelles Lernverfahren, das ein Klassifikationsmodell trainiert. Dieses Modell ist in der Lage, neue Kandidaten für Hypernymen als solche oder nicht als solche zu klassifizieren. Unser System zeigt eine gute Leistung bei der Entdeckung neuer Hypernymen, die nicht in den gold-standard-Hypernymen enthalten sind.