HyperAIHyperAI
il y a 16 jours

Tha3aroon à la tâche 8 d'NSURL-2019 : Similarité sémantique des questions en arabe

Ali Fadel, Ibraheem Tuffaha, Mahmoud Al-Ayyoub
Tha3aroon à la tâche 8 d'NSURL-2019 : Similarité sémantique des questions en arabe
Résumé

Dans cet article, nous décrivons les efforts de notre équipe dans la tâche de similarité sémantique entre questions textuelles au sein de NSURL 2019. Notre système performant utilise plusieurs techniques innovantes d’augmentation de données afin d’élargir l’ensemble d’apprentissage. Ensuite, il exploite des embeddings contextuels pré-entraînés ELMo sur les données, qu’il alimente dans un réseau ON-LSTM doté d’un mécanisme d’attention auto-attention. Ce processus produit des vecteurs de représentation séquentielle utilisés pour prédire la relation entre les paires de questions. Le modèle obtient la première place avec un score F1 de 96,499 (identique au score F1 de la deuxième place) sur le classement public, et la deuxième place avec un score F1 de 94,848 (différent de 1,076 points F1 par rapport à la première place) sur le classement privé.

Tha3aroon à la tâche 8 d'NSURL-2019 : Similarité sémantique des questions en arabe | Articles de recherche récents | HyperAI