HyperAIHyperAI

Command Palette

Search for a command to run...

BEIR : Un benchmark hétérogène pour l’évaluation zéro-shot des modèles de recherche d’information

Nandan Thakur Nils Reimers Andreas Rücklé Abhishek Srivastava Iryna Gurevych

Résumé

Les modèles existants de recherche d'information (IR) basés sur les réseaux neuronaux ont souvent été étudiés dans des environnements homogènes et restreints, ce qui a considérablement limité les perspectives sur leurs capacités de généralisation hors distribution (OOD). Pour remédier à ce problème et faciliter aux chercheurs une évaluation large et approfondie de l'efficacité de leurs modèles, nous introduisons Benchmarking-IR (BEIR), un cadre d'évaluation robuste et hétérogène pour la recherche d'information. Nous avons sélectionné soigneusement 18 jeux de données publiques provenant de tâches et domaines variés de recherche textuelle, et évalué 10 systèmes de recherche d'état de l'art, incluant des architectures lexicales, creuses, denses, à interaction tardive et à re-rangement, sur le benchmark BEIR. Nos résultats montrent que BM25 constitue une base solide, tandis que les modèles basés sur le re-rangement et l'interaction tardive atteignent en moyenne les meilleurs performances en mode zero-shot, bien que cela s'accompagne d'un coût computationnel élevé. À l'inverse, les modèles de recherche denses et creux sont plus efficaces sur le plan computationnel, mais se situent souvent en dessous des autres approches, soulignant ainsi un important potentiel d'amélioration de leurs capacités de généralisation. Nous espérons que ce cadre permettra une évaluation et une compréhension plus approfondies des systèmes de recherche existants, et contribuera à accélérer les progrès vers des systèmes futurs plus robustes et généralisables. BEIR est disponible publiquement à l'adresse suivante : https://github.com/UKPLab/beir.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
BEIR : Un benchmark hétérogène pour l’évaluation zéro-shot des modèles de recherche d’information | Articles | HyperAI