il y a 4 mois
Identification de paraphrases neuronales de questions avec un préentraînement bruyant
Gaurav Singh Tomar; Thyago Duque; Oscar Täckström; Jakob Uszkoreit; Dipanjan Das

Résumé
Nous présentons une solution au problème d'identification de paraphrases de questions. Nous nous concentrons sur un jeu de données récent composé de paires de questions annotées avec des étiquettes binaires de paraphrase et montrons qu'une variante du modèle d'attention décomposable (Parikh et al., 2016) offre des performances précises sur cette tâche, tout en étant bien plus simple que nombre d'architectures neuronales concurrentes. De plus, lorsque le modèle est pré-entraîné sur un jeu de données bruyant de paraphrases de questions collectées automatiquement, il obtient les meilleures performances rapportées sur ce jeu de données.