Command Palette
Search for a command to run...
MedReseacher-R1 : Chercheur médical profond de niveau expert grâce à un cadre de synthèse de trajectoire informé par les connaissances

Résumé
Les récents progrès réalisés dans les agents fondés sur les grands modèles linguistiques (LLM) ont fait preuve de capacités remarquables s'étendant à de nombreux domaines, comme en témoignent les systèmes de recherche approfondie capables de performances supérieures sur des tâches complexes d’acquisition et de synthèse d’information. Bien que les agents de recherche approfondie à usage général aient démontré des capacités impressionnantes, ils peinent considérablement face aux défis propres au domaine médical, comme le montre la faible précision atteinte par les systèmes propriétaires de pointe sur des benchmarks médicaux complexes. Les principales limites résident dans : (1) le manque de connaissances médicales denses nécessaires au raisonnement clinique, et (2) le cadre d’exploitation contraint par l’absence d’outils de recherche spécialisés adaptés aux contextes médicaux. Nous présentons un agent de recherche approfondie médicale qui surmonte ces défis grâce à deux innovations fondamentales. Premièrement, nous développons un nouveau cadre de synthèse de données reposant sur des graphes de connaissances médicales, permettant d’extraire les chaînes les plus longues à partir de sous-graphes centrés sur des entités médicales rares, afin de générer des paires de questions-réponses complexes impliquant plusieurs sauts (multi-hop). Deuxièmement, nous intégrons un moteur de recherche médical privé sur mesure, complété par des outils généraux, permettant une synthèse précise d’informations médicales. Notre approche produit plus de 2 100 trajectoires diversifiées réparties sur 12 spécialités médicales, chacune comportant en moyenne 4,2 interactions avec des outils. Grâce à un paradigme d’entraînement en deux étapes combinant une fine-tuning supervisée et un apprentissage par renforcement en ligne avec des récompenses composites, le modèle MedResearcher-R1-32B démontre des performances exceptionnelles, établissant de nouveaux records sur les benchmarks médicaux tout en maintenant des performances compétitives sur les tâches générales de recherche approfondie. Nos résultats montrent qu’une innovation stratégique, portant sur l’architecture, la conception d’outils et la construction des données d’entraînement, permet à des modèles open-source plus petits de surpasser des systèmes propriétaires bien plus volumineux dans des domaines spécialisés.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.