PaperRegister : Accroître la recherche flexible à granularité fine de documents grâce à l'indexation hiérarchique par registre
PaperRegister : Accroître la recherche flexible à granularité fine de documents grâce à l'indexation hiérarchique par registre
Zhuoqun Li Xuanang Chen Hongyu Lin Yaojie Lu Xianpei Han Le Sun

Résumé
La recherche de documents constitue une activité essentielle pour les chercheurs, qui consiste généralement à formuler une requête décrivant un sujet afin de localiser des articles pertinents. À mesure que la recherche s’approfondit, les exigences en matière de recherche de documents peuvent devenir plus souples, parfois incluant des détails spécifiques tels que la configuration d’un module, au lieu de se limiter à des sujets de grande ampleur. Toutefois, les systèmes existants de recherche de documents peinent à répondre à ces besoins de granularité flexible, car ces systèmes s’appuient principalement sur les résumés des articles pour construire un index du corpus, qui manquent de détails suffisants pour soutenir une récupération efficace à partir de requêtes à granularité fine. Dans ce travail, nous proposons PaperRegister, un système fondé sur un index hiérarchique préalablement construit (offline) et une récupération adaptative en ligne, qui transforme l’index traditionnel basé sur les résumés en un arbre d’index hiérarchique dédié à la recherche de documents, permettant ainsi de traiter des requêtes à différentes granularités. Des expérimentations menées sur des tâches de recherche de documents couvrant une large gamme de granularités montrent que PaperRegister atteint des performances de pointe, et se distingue particulièrement dans les scénarios à granularité fine, soulignant son fort potentiel comme solution efficace pour la recherche de documents à granularité flexible dans des applications réelles. Le code associé à ce travail est disponible à l’adresse suivante : https://github.com/Li-Z-Q/PaperRegister.
Dépôts de code
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.