Réseaux d'induction pour la classification de texte à quelques exemples

La classification de texte rencontre souvent des difficultés lorsque les données sont insuffisantes ou lorsqu'elle doit s'adapter à des classes inconnues. Dans ces scénarios complexes, des études récentes ont utilisé le méta-apprentissage pour simuler la tâche de few-shot, où de nouvelles requêtes sont comparées à un petit ensemble de référence au niveau individuel. Cependant, cette comparaison individuelle peut être fortement perturbée par les différentes expressions au sein d'une même classe. Par conséquent, nous devrions être en mesure d'apprendre une représentation générale de chaque classe dans l'ensemble de référence, puis de la comparer aux nouvelles requêtes. Dans cet article, nous proposons un nouveau réseau d'induction (Induction Network) pour apprendre une telle représentation généralisée au niveau des classes, en exploitant innovamment l'algorithme de routage dynamique dans le cadre du méta-apprentissage. Nous constatons ainsi que le modèle est capable d'induire et de généraliser de manière plus efficace. Nous évaluons le modèle proposé sur un jeu de données bien étudié pour la classification des sentiments (en anglais) et sur un jeu de données réel pour la classification des intentions dans les dialogues (en chinois). Les résultats expérimentaux montrent que sur les deux jeux de données, le modèle proposé surpasse significativement les approches existantes les plus performantes, démontrant ainsi l'efficacité de la généralisation au niveau des classes dans la classification de texte en few-shot.