HyperAIHyperAI
il y a 11 jours

JBNU-CCLab dans SemEval-2022 Tâche 12 : Compréhension automatique de lecture et classification de paires d'intervalles pour lier des symboles mathématiques à leurs descriptions

{Seung-Hoon Na, Sung-Min Lee}
JBNU-CCLab dans SemEval-2022 Tâche 12 : Compréhension automatique de lecture et classification de paires d'intervalles pour lier des symboles mathématiques à leurs descriptions
Résumé

Cet article décrit notre système pour la tâche 12 du SemEval-2022 : « lier les symboles mathématiques à leurs descriptions », qui a obtenu la première place au classement pour l'ensemble des sous-tâches comprenant l'extraction d'entités nommées (NER) et l'extraction de relations (RE). Notre système repose sur un modèle en deux étapes basé sur SciBERT, conçu pour détecter les symboles, leurs descriptions et les relations qui les lient dans les documents scientifiques. Il se compose de deux composants principaux : 1) un modèle de NER fondé sur la compréhension automatique de lecture (MRC), dans lequel chaque type d'entité est représenté sous forme de question, et l'intervalle mentionnant l'entité est extrait comme réponse à l'aide d'un modèle MRC ; 2) une classification de paires d'intervalles pour l'EXR, où deux mentions d'entités ainsi que leurs marqueurs de type sont encodés en représentations d'intervalle, puis alimentés dans un classificateur Softmax. Par ailleurs, nous avons mis en œuvre un tokeniseur basé sur des règles afin d'améliorer la précision de détection des limites exactes des entités symboliques. Des méthodes de régularisation et d'ensemblage ont également été explorées afin d'améliorer les performances du modèle d'extraction de relations.

JBNU-CCLab dans SemEval-2022 Tâche 12 : Compréhension automatique de lecture et classification de paires d'intervalles pour lier des symboles mathématiques à leurs descriptions | Articles de recherche récents | HyperAI