Les agents fondés sur les LLM pour la cartographie du paysage concurrentiel dans le cadre de l'analyse approfondie des actifs pharmaceutiques

Dans cet article, nous décrivons et évaluons un composant de découverte de concurrents intégré dans un système d’IA agente dédié à l’analyse rapide des actifs pharmaceutiques. Un agent d’IA spécialisé dans la découverte de concurrents, à partir d’une indication thérapeutique donnée, extrait l’ensemble des médicaments constituant le paysage concurrentiel associé à cette indication, tout en récupérant des attributs canoniques pour chacun d’eux. La définition des concurrents est spécifique aux investisseurs ; les données sont protégées par des accès payants ou sous licence, fragmentées à travers divers registres, mal alignées en raison de différences d’ontologie entre indications, marquées par une forte densité d’alias pour les noms de médicaments, multimodales et en évolution rapide. Bien que considérées comme les meilleurs outils pour ce type de tâche, les systèmes d’IA actuels basés sur les grands modèles linguistiques (LLM) ne parviennent pas à récupérer de manière fiable tous les noms de médicaments concurrents, et aucune évaluation publique reconnue n’existe à ce jour pour cette tâche. Pour pallier ce manque d’évaluation, nous utilisons des agents basés sur les LLM afin de transformer cinq ans de mémos d’analyse non structurés et multimodaux provenant d’un fonds de capital-investissement biotechnologique privé en un corpus évaluatif structuré, associant les indications aux médicaments concurrents via des attributs normalisés. Nous introduisons également un agent d’évaluation des concurrents basé sur un LLM « comme juge », chargé d’éliminer les faux positifs parmi les médicaments prédits, afin de maximiser la précision et de réduire les hallucinations. Sur ce benchmark, notre agent de découverte de concurrents atteint un rappel de 83 %, dépassant les performances d’OpenAI Deep Research (65 %) et de Perplexity Labs (60 %). Le système est désormais déployé en production auprès d’utilisateurs enterprise ; dans une étude de cas menée avec un fonds de capital-investissement biotechnologique, le temps de traitement par les analystes pour l’analyse concurrentielle a été réduit de 2,5 jours à environ 3 heures (soit un gain d’environ 20 fois).