HIT-SCIR à MRP 2019 : Une pipeline unifiée pour le parsing de la représentation du sens par une formation efficace et une encodage effectif

Cet article décrit notre système (HIT-SCIR) pour la tâche partagée CoNLL 2019 : Analyse de représentation du sens à travers des cadres variés. Nous avons amélioré le parseur fondé sur les transitions de base en introduisant deux innovations : a) une formation efficace grâce à l’entraînement parallèle du modèle Stack LSTM ; b) une encodage efficace en adoptant des représentations contextuelles profondes des mots basées sur BERT. Globalement, nous proposons une chaîne unifiée pour la tâche d’analyse de représentation du sens, comprenant des parseurs basés sur les transitions spécifiques à chaque cadre, des représentations de mots améliorées par BERT, ainsi qu’un post-traitement. Lors de l’évaluation finale, notre système a obtenu la première place selon le score ALL-F1 (86,2 %), et notamment la première place dans le cadre UCCA (81,67 %).