HyperAIHyperAI
il y a 18 jours

L’échantillonnage compte ! Une étude empirique des stratégies d’échantillonnage négatif pour l’apprentissage des modèles de correspondance dans les systèmes de dialogue basés sur la récupération

{Chongyang Tao, Wei Wu, Rui Yan, Dongyan Zhao, Yansong Feng, Jia Li}
L’échantillonnage compte ! Une étude empirique des stratégies d’échantillonnage négatif pour l’apprentissage des modèles de correspondance dans les systèmes de dialogue basés sur la récupération
Résumé

Nous étudions la manière de sélectionner des exemples négatifs afin de construire automatiquement un ensemble d'apprentissage pour une apprentissage efficace des modèles dans les systèmes de dialogue basés sur la récupération. En suivant l'idée d'adapter dynamiquement les exemples négatifs aux modèles de correspondance pendant l'apprentissage, nous considérons quatre stratégies : l'échantillonnage minimum, l'échantillonnage maximum, l'échantillonnage semi-dur et l'échantillonnage à décroissance dur. Des études empiriques menées sur deux benchmarks avec trois modèles de correspondance montrent qu'en comparaison avec la stratégie d'échantillonnage aléatoire largement utilisée, bien que les deux premières stratégies entraînent une baisse des performances, les deux dernières permettent d'améliorer de manière cohérente les performances de tous les modèles sur les deux benchmarks.