HyperAIHyperAI
il y a 17 jours

Capacités des modèles Gemini en médecine

Khaled Saab, Tao Tu, Wei-Hung Weng, Ryutaro Tanno, David Stutz, Ellery Wulczyn, Fan Zhang, Tim Strother, Chunjong Park, Elahe Vedadi, Juanma Zambrano Chaves, Szu-Yeu Hu, Mike Schaekermann, Aishwarya Kamath, Yong Cheng, David G. T. Barrett, Cathy Cheung, Basil Mustafa, Anil Palepu, Daniel McDuff, Le Hou, Tomer Golany, Luyang Liu, Jean-baptiste Alayrac, Neil Houlsby, Nenad Tomasev, Jan Freyberg, Charles Lau, Jonas Kemp, Jeremy Lai, Shekoofeh Azizi, Kimberly Kanada, SiWai Man, Kavita Kulkarni, Ruoxi Sun, Siamak Shakeri, Luheng He, Ben Caine, Albert Webson, Natasha Latysheva, Melvin Johnson, Philip Mansfield, Jian Lu, Ehud Rivlin, Jesper Anderson, Bradley Green, Renee Wong, Jonathan Krause, Jonathon Shlens, Ewa Dominowska, S. M. Ali Eslami, Claire Cui, Oriol Vinyals, Koray Kavukcuoglu, James Manyika, Jeff Dean, Demis Hassabis, Yossi Matias, Dale Webster, Joelle Barral, Greg Corrado, Christopher Semturs, S. Sara Mahdavi, Juraj Gottweis, Alan Karthikesalingam, Vivek Natarajan
Capacités des modèles Gemini en médecine
Résumé

L’excellence dans une large variété d’applications médicales pose des défis considérables pour l’intelligence artificielle, nécessitant des raisonnements avancés, un accès aux connaissances médicales à jour et une compréhension approfondie des données multimodales complexes. Les modèles Gemini, dotés de puissantes capacités générales en raisonnement multimodal et en traitement de longs contextes, ouvrent des perspectives prometteuses dans le domaine médical. Partant de ces forces fondamentales, nous introduisons Med-Gemini, une famille de modèles multimodaux hautement performants spécialisés dans le domaine médical, capables d’utiliser de manière fluide la recherche sur le web et de s’adapter efficacement à de nouveaux types de données grâce à des encodeurs personnalisés. Nous évaluons Med-Gemini sur 14 benchmarks médicaux, établissant un nouveau record d’état de l’art (SoTA) sur 10 d’entre eux, et surpassant la famille de modèles GPT-4 sur chaque benchmark permettant une comparaison directe, souvent de manière significative. Sur le benchmark populaire MedQA (USMLE), notre modèle Med-Gemini le plus performant atteint une précision SoTA de 91,1 %, grâce à une stratégie novatrice de recherche guidée par l’incertitude. Sur 7 benchmarks multimodaux, incluant les défis d’images du NEJM et MMMU (santé et médecine), Med-Gemini améliore GPT-4V en moyenne de 44,5 % en termes de gain relatif. Nous démontrons l’efficacité des capacités de long contexte de Med-Gemini en obtenant des performances SoTA sur une tâche de recherche de données rares dans de longs dossiers médicaux anonymisés ainsi que sur la réponse à des questions issues de vidéos médicales, surpassant ainsi les méthodes spécialisées antérieures utilisant uniquement l’apprentissage par exemple. Enfin, les performances de Med-Gemini suggèrent une utilité concrète dans des contextes réels, dépassant même les experts humains sur des tâches telles que la synthèse de textes médicaux, tout en illustrant un potentiel prometteur pour les dialogues médicaux multimodaux, la recherche médicale et l’éducation. Ensemble, nos résultats fournissent des preuves convaincantes du potentiel de Med-Gemini, bien que des évaluations rigoureuses supplémentaires restent essentielles avant un déploiement réel dans ce domaine critique pour la sécurité.

Capacités des modèles Gemini en médecine | Articles de recherche récents | HyperAI