HyperAI
Back to Headlines

Des Chercheurs d'ETH et de Stanford Présentent MIRIAD : Un Jeu de Données de 5,8 Millions de Paires pour Améliorer la Précision des LLMs en IA Médicale

il y a 2 jours

MIRIAD : Un Nouveau Jeu de Données pour Améliorer l'Exactitude des Modèles Linguistiques dans l'IA Médicale Défis des Modèles de Langue (LLMs) dans le Prise de Décisions Médicales : La Préservation de la Validité des Informations Les modèles linguistiques (LLMs) présentent une immense promesse en matière de santé grâce à leur capacité à offrir un soutien décisionnel intelligent et à s'adapter aux besoins des patients via des assistants conversationnels. Cependant, leur utilisation en milieu médical reste entravée par leur tendance à générer des informations médicales factuellement incorrectes, un phénomène connu sous le nom de « hallucinations ». Pour atténuer ce problème, une approche couramment adoptée est le RAG (Retrieval-Augmented Generation), où des connaissances externes médicamenteuses sont fragmentées en petits segments textuels que les LLMs peuvent récupérer et utiliser pendant la génération de réponses. Malgré son potentiel, cette méthode souffre de limites majeures car les sources de connaissances médicales, souvent non structurées, bruyantes et mal filtrées, ne sont pas adaptées à l'interprétation précise des modèles. Limitations Actuelles des Approches RAG en IA Médicale Bien que les LLMs brillent dans les tâches de traitement du langage général, ils peinent souvent en domaines nécessitant des connaissances à jour et précises comme la médecine. Le RAG propose une alternative rentable au coût élevé de l'amélioration personnalisée des modèles en leur fournissant un ancrage dans des documents externes. Actuellement, de nombreux systèmes RAG reposent sur des plongements textuels (embeddings) généraux et des bases de données vectorielles standard, qui ne sont pas spécifiquement optimisées pour le contenu médical. Par conséquent, le champ médical manque de jeux de données de grande ampleur et de haute qualité associant des questions médicales à des réponses pertinentes. Les jeux de données existants, tels que PubMedQA ou MedQA, sont soit trop petits, soit excessivement structurés (par exemple, avec des questions à choix multiples), ou ne fournissent pas les types de réponses ouvertes et réalistes nécessaires pour construire des systèmes robustes de récupération médicale. Présentation de MIRIAD : Une Base de Données Structurée et Fiable Pour combler ce vide, des chercheurs issus de l'ETH Zurich, de Stanford, du Mayo Clinic et d'autres institutions ont élaboré MIRIAD, un jeu de données d'envergure comprenant plus de 5,8 millions de paires question-réponse médicamenteuses de haute qualité. Chaque paire a été soigneusement reformulée et verifiée par confrontation à un corpus de littérature scientifique à comité de lecture. Cette approach novatrice permet une organisation et une présentation structurées des connaissances médicales, favorisant l'utilisation fiable et précise des LLMs. MIRIAD ne se Contentent pas d'offrir des paires structurées, il comprend également MIRIAD-Atlas, un outil visuel interactif couvrant 56 domaines différents de la médecine, qui facilite l'exploration de cette ressource riche et complexe. Processus de Construction du JEU de Données La création de MIRIAD a été un effort méticuleux. Les chercheurs ont commencé par filtrer 894 000 articles médicaux de la base de données S2ORC, les décomposant ensuite en passages textuels nets et courts pour éliminer les contenus trop longs ou bruyants. En utilisant des plongements linguistiques et des prompts structurés, ils ont généré plus de 10 millions de paires question-réponse, qu'ils ont ensuite réduites à 5,8 millions par des filtres basés sur des règles. Un classificateur personnalisé, formé à partir des labels de GPT-4, a permis de sélectionner 4,4 millions de paires de haute qualité. Des experts médicaux humains ont validé un échantillon de ces paires pour garantir leur précision, pertinence et ancrage dans la littérature. MIRIAD-Atlas, quant à lui, est un atlas interactif 2D qui utilise des techniques de plongement et de réduction de dimensionalité pour regrouper les contenus liés par sujet et discipline. Avantages en Termes de Performance L'introduction de MIRIAD a significativement amélioré les performances des modèles linguistiques en matière de questions et réponses médicales. Utilisé dans un cadre RAG, ces modèles ont atteint une augmentation de précision allant jusqu'à 6,7% par rapport à l'utilisation de données non structurées, ce, même avec la même quantité de contenu récupéré. De plus, MIRIAD a renforcé la capacité des modèles à détecter les hallucinations linguistiques, avec des augmentations du score F1 variant de 22,5% à 37%. L'entraînement des modèles de récupération sur MIRIAD a également conduit à une meilleure qualité de récupération. Cette structure, solidement ancrée dans une littérature vérifiée, permet un accès plus précis et fiable aux informations, soutenant ainsi une gamme étendue de applications médicales. Potentiel de MIRIAD-Atlas : Exploration Visuelle et Interaction En définitive, MIRIAD représente un grand pas en avant dans l'amélioration de la fiabilité des systèmes d'IA médicale. Il offre un vaste ensemble de 5,8 millions de paires question-réponse médicales de qualité, toutes ancrées dans des articles scientifiques à comité de lecture. MIRIAD-Atlas, l'outil interactif associé, facilite l'exploration de ces données, permettant ainsi une utilisation plus intuitive et efficace. Bien que MIRIAD ne soit pas exhaustif, il constitue une base solide pour le développement de futurs jeux de données et applications en IA médicale. Évaluation de l'Événement par des Professionnels de l'Industrie et Profil de l'Entreprise Les avancées réalisées par l'équipe derrière MIRIAD ont été largement saluées par la communauté scientifique et les professionnels de l'IA médicale. Ils estiment que ce nouveau jeu de données pourrait devenir un standard de l'industrie, en raison de sa précision inégalée et de sa structure bien pensée. L'ETH Zurich et Stanford, célèbres pour leurs contributions en recherche et développement, continuent d'innover dans le domaine de l'intelligence artificielle, particulièrement en ce qui concerne l'application de l'IA au secteur de la santé. La collaboration de ces institutions de renom avec des établissements médicaux tels que le Mayo Clinic témoigne de l'importance qu'on accorde à la précision et à la fiabilité des outils d'IA médicale. Sources : - Recherche : Paper sur MIRIAD - Code et Datasets : GitHub Page, Hugging Face

Related Links