HyperAIHyperAI
il y a 4 mois

Réseau augmenté de marqueurs discursifs avec apprentissage par renforcement pour l'inférence en langage naturel

Boyuan Pan; Yazheng Yang; Zhou Zhao; Yueting Zhuang; Deng Cai; Xiaofei He
Réseau augmenté de marqueurs discursifs avec apprentissage par renforcement pour l'inférence en langage naturel
Résumé

L'inférence de langage naturel (NLI), également connue sous le nom de reconnaissance d'entraînement textuel (RTE), est l'un des problèmes les plus importants en traitement du langage naturel. Elle nécessite d'inférer la relation logique entre deux phrases données. Bien que les approches actuelles se concentrent principalement sur les architectures d'interaction des phrases, dans cet article, nous proposons de transférer des connaissances à partir de certains marqueurs discursifs importants pour améliorer la qualité du modèle NLI. Nous constatons que les personnes utilisent généralement des marqueurs discursifs tels que "so" (donc) ou "but" (mais) pour représenter la relation logique entre deux phrases. Ces mots ont potentiellement des liens profonds avec les significations des phrases et peuvent donc être exploités pour améliorer leurs représentations. De plus, nous utilisons l'apprentissage par renforcement pour optimiser une nouvelle fonction objectif, avec une récompense définie par les propriétés des jeux de données NLI, afin d'utiliser pleinement les informations étiquetées. Les expériences montrent que notre méthode atteint des performances de pointe sur plusieurs jeux de données à grande échelle.