HyperAIHyperAI

Command Palette

Search for a command to run...

BM25S : Recherche lexicale ordres de grandeur plus rapide grâce à une évaluation précoce des scores creux

Xing Han Lù

Résumé

Nous présentons BM25S, une implémentation efficace en Python de l'algorithme BM25, qui ne dépend que de Numpy et Scipy. BM25S atteint jusqu'à un accélération de 500 fois par rapport au cadre Python le plus populaire, en calculant de manière précoce les scores BM25 lors de l'indexation et en les stockant dans des matrices creuses. Elle offre également des gains de vitesse significatifs par rapport à des implémentations Java hautement optimisées, largement utilisées dans des produits commerciaux courants. Enfin, BM25S reproduit fidèlement l'implémentation exacte de cinq variantes BM25 décrites par Kamphuis et al. (2020), en étendant la méthode de calcul anticipé aux variantes non creuses grâce à une nouvelle méthode de décalage des scores. Le code source est disponible à l'adresse suivante : https://github.com/xhluca/bm25s


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
BM25S : Recherche lexicale ordres de grandeur plus rapide grâce à une évaluation précoce des scores creux | Articles | HyperAI