Les représentations au niveau des caractères améliorent l'analyse sémantique basée sur les DRS, même à l'ère de BERT.

Nous combinons des représentations de modèles de langage au niveau des caractères et contextuelles pour améliorer les performances dans l'analyse de la structure de représentation du discours (Discourse Representation Structure). Les représentations au niveau des caractères peuvent être facilement intégrées dans un modèle séquence-à-séquence, soit dans un encodeur unique, soit comme un encodeur entièrement distinct, avec des améliorations robustes à différents modèles de langage, langues et ensembles de données. Pour l'anglais, ces améliorations sont plus importantes que l'ajout d'informations linguistiques individuelles ou d'embeddings non contextuels. Une nouvelle méthode d'analyse basée sur des balises sémantiques montre que les représentations au niveau des caractères améliorent les performances sur un sous-ensemble de phénomènes sémantiques sélectionnés.