HyperAIHyperAI
il y a 2 mois

Le monde n'est pas binaire : apprentissage du classement avec des données en niveaux de gris pour la sélection de réponses dans les dialogues

Zibo Lin; Deng Cai; Yan Wang; Xiaojiang Liu; Hai-Tao Zheng; Shuming Shi
Le monde n'est pas binaire : apprentissage du classement avec des données en niveaux de gris pour la sélection de réponses dans les dialogues
Résumé

La sélection de réponses joue un rôle crucial dans la construction de systèmes de conversation basés sur la recherche. Bien que la sélection de réponses soit naturellement un problème d'apprentissage pour le classement, la plupart des travaux antérieurs adoptent une approche ponctuelle et forment des classifieurs binaires pour cette tâche : chaque candidat à la réponse est étiqueté comme pertinent (un) ou non pertinent (zéro). D'une part, cette formalisation peut être sous-optimale en raison de son ignorance de la diversité de la qualité des réponses. D'autre part, l'annotation de données en niveaux de gris pour l'apprentissage pour le classement peut être extrêmement coûteuse et difficile. Dans ce travail, nous montrons que les données en niveaux de gris peuvent être construites automatiquement sans effort humain. Notre méthode utilise des modèles de recherche de réponses et des modèles de génération de réponses préexistants comme générateurs automatiques de données en niveaux de gris. Avec les données en niveaux de gris construites, nous proposons des objectifs de classement à plusieurs niveaux pour l'entraînement, qui peuvent (1) enseigner à un modèle d'appariement à capturer des différences plus fines entre le contexte et la pertinence des réponses, et (2) réduire la discordance entre l'entraînement et le test en termes de force des distractions. Notre méthode est simple, efficace et universelle. Les expériences menées sur trois jeux de données基准数据集 (benchmark datasets) et quatre modèles d'appariement d'avant-garde montrent que l'approche proposée apporte des améliorations significatives et cohérentes des performances.注:在法语文本中,我保留了“基准数据集”(benchmark datasets)的中文表述,并在其后标注了英文原文,以确保信息的完整性。