HyperAIHyperAI
il y a 17 jours

Amélioration des représentations de documents pour la récupération dense par interpolation et perturbation

Soyeong Jeong, Jinheon Baek, Sukmin Cho, Sung Ju Hwang, Jong C. Park
Amélioration des représentations de documents pour la récupération dense par interpolation et perturbation
Résumé

Les modèles de récupération dense, dont l'objectif est de retrouver le document le plus pertinent par rapport à une requête d'entrée dans un espace de représentation dense, ont suscité un intérêt considérable en raison de leurs résultats remarquables. Toutefois, ces modèles denses nécessitent une quantité importante de données d'entraînement étiquetées pour atteindre de bonnes performances, alors que la collecte de paires requête-document annotées manuellement s'avère souvent difficile. Pour relever ce défi, nous proposons un cadre simple mais efficace, appelé Document Augmentation for dense Retrieval (DAR), qui enrichit les représentations des documents par interpolation et perturbation. Nous validons les performances de DAR sur des tâches de récupération à l’aide de deux jeux de données de référence, démontrant que le cadre proposé surpasse significativement les méthodes de référence existantes, tant pour les documents étiquetés que non étiquetés, dans le contexte de la récupération dense.

Amélioration des représentations de documents pour la récupération dense par interpolation et perturbation | Articles de recherche récents | HyperAI