HyperAIHyperAI
il y a 16 jours

BiomedGPT : un modèle fondamental vision-langage généraliste pour des tâches biomédicales diverses

Kai Zhang, Rong Zhou, Eashan Adhikarla, Zhiling Yan, Yixin Liu, Jun Yu, Zhengliang Liu, Xun Chen, Brian D. Davison, Hui Ren, Jing Huang, Chen Chen, Yuyin Zhou, Sunyang Fu, Wei Liu, Tianming Liu, Xiang Li, Yong Chen, Lifang He, James Zou, Quanzheng Li, Hongfang Liu, Lichao Sun
BiomedGPT : un modèle fondamental vision-langage généraliste pour des tâches biomédicales diverses
Résumé

Les modèles traditionnels d’intelligence artificielle (IA) biomédicale, conçus pour des tâches ou modalités spécifiques, présentent souvent une flexibilité limitée dans leur déploiement en situation réelle et peinent à exploiter de manière intégrée les informations disponibles. L’IA généraliste possède un potentiel considérable pour surmonter ces limitations grâce à sa capacité à interpréter divers types de données et à générer des sorties adaptées à des besoins variés. Toutefois, les solutions actuelles d’IA généraliste en biomédecine sont généralement lourdes et non disponibles en code source ouvert pour les chercheurs, les praticiens et les patients. Dans cette étude, nous proposons BiomedGPT, le premier modèle fondamental vision-langage léger et open source, conçu comme une IA généraliste capable d’effectuer une large gamme de tâches biomédicales. BiomedGPT atteint des résultats de pointe dans 16 expériences sur un total de 25, tout en maintenant une taille de modèle compatible avec les contraintes informatiques. Nous avons également mené des évaluations humaines pour évaluer les capacités de BiomedGPT dans des tâches de réponse à des questions visuelles en radiologie, de génération de rapports et de synthèse. BiomedGPT démontre une robustesse prédictive remarquable, avec un taux d’erreur de seulement 3,8 % en réponse aux questions, des performances satisfaisantes avec un taux d’erreur de 8,3 % pour la rédaction de rapports radiologiques complexes, ainsi qu’une capacité de synthèse compétitive, obtenue avec un score de préférence presque équivalent à celui des experts humains. Notre approche démontre que l’entraînement efficace à partir de données diversifiées peut conduire à des systèmes d’IA biomédicale plus pratiques, capables d’améliorer le diagnostic et l’efficacité des processus cliniques.