Command Palette
Search for a command to run...
MedSAM3 : Exploration du Segment Anything à travers des concepts médicaux
Anglin Liu Rundong Xue Xu R. Cao Yifan Shen Yi Lu Xiang Li Qianqian Chen Jintai Chen

Résumé
La segmentation d’images médicales est fondamentale pour les découvertes en biomédecine. Les méthodes existantes manquent de généralisation et nécessitent des annotations manuelles étendues et chronophages pour chaque nouvelle application clinique. Dans cet article, nous proposons MedSAM-3, un modèle de segmentation médicale pilotable par texte, destiné à la segmentation d’images et de vidéos médicales. En fine-tunant l’architecture du Segment Anything Model (SAM) 3 sur des images médicales associées à des étiquettes sémantiques conceptuelles, notre modèle MedSAM-3 permet la segmentation conceptuelle pilotable par texte (PCS), permettant ainsi une localisation précise des structures anatomiques à l’aide de descriptions textuelles à vocabulaire ouvert, au lieu de se limiter à des promps géométriques. Nous introduisons également le MedSAM-3 Agent, un cadre intégrant des modèles de langage à grande échelle multimodaux (MLLM) pour effectuer un raisonnement complexe et une révision itérative dans un flux de travail avec agent en boucle. Des expériences approfondies menées sur diverses modalités d’imagerie médicale — radiographies, IRM, échographies, scanners CT et vidéos — démontrent que notre approche surpasse significativement les modèles spécialisés et fondamentaux existants. Nous mettrons à disposition notre code et nos modèles à l’adresse suivante : https://github.com/Joey-S-Liu/MedSAM3.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.