Amélioration de l'extraction de relations à l'aide d'indicateurs syntaxiques et de contextes sententiels

Les méthodes de pointe pour l’extraction de relations prennent en compte le contexte sententiel en modélisant l’intégralité de la phrase. Toutefois, certains indicateurs syntaxiques — comme des prépositions ou des expressions spécifiques — sont plus informatifs que d’autres mots et peuvent s’avérer particulièrement utiles pour identifier les relations sémantiques. D’autres approches utilisant des déclencheurs textuels fixes permettent de capturer ces informations, mais elles négligent la diversité lexicale. Afin d’exploiter à la fois les indicateurs syntaxiques et le contexte sententiel, nous proposons une approche consciente des indicateurs pour l’extraction de relations. Premièrement, nous extrayons les indicateurs syntaxiques sous la guidance des connaissances syntaxiques. Ensuite, nous construisons un réseau neuronal capable d’intégrer à la fois les indicateurs syntaxiques et l’ensemble de la phrase afin d’obtenir des représentations relationnelles améliorées. Grâce à cette approche, le modèle proposé atténue l’impact des informations bruyantes provenant de la phrase entière et surmonte les limites imposées par les déclencheurs textuels fixes. Des expériences menées sur le jeu de données de référence SemEval-2010 Task 8 montrent que notre modèle surpasse significativement les méthodes de pointe existantes.