EXPR dans le cadre de la tâche 9 de SemEval-2018 : Une approche combinée pour la découverte d'hyperonymes

Dans cet article, nous présentons notre système proposé (EXPR) destiné à participer à la tâche de découverte d’hyperonymes du SemEval 2018. Cette tâche vise à relever le défi de la découverte de relations d’hyperonymie à partir d’un corpus textuel. Notre approche repose sur une combinaison de techniques basées sur les chemins et de techniques distributionnelles. Nous utilisons un parseur de dépendances sur un corpus afin d’extraire des candidats à l’hyperonymie, puis représentons leurs chemins de dépendance sous forme de vecteur de caractéristiques. Ce vecteur est concaténé à un autre vecteur de caractéristiques obtenu à partir d’un modèle d’embeddings de termes pré-entraînés sur Wikipedia. Le vecteur de caractéristiques concaténé est ensuite utilisé pour entraîner un modèle de classification par apprentissage automatique supervisé. Ce modèle est capable de classer de nouveaux candidats à l’hyperonymie comme étant effectivement des hyperonymes ou non. Notre système se distingue par une bonne performance dans la découverte de nouveaux hyperonymes non présents dans les étiquettes d’or (gold hypernyms).