Command Palette
Search for a command to run...
Med-Banana-50K : Un grand jeu de données multimodales pour l'édition d'images médicales guidée par le texte
Med-Banana-50K : Un grand jeu de données multimodales pour l'édition d'images médicales guidée par le texte
Zhihui Chen Mengling Feng
Abstract
L’édition d’images médicales est devenue une technologie essentielle, aux applications multiples dans le renforcement des données, l’interprétabilité des modèles, l’enseignement médical et la simulation thérapeutique. Toutefois, le manque de jeux de données à grande échelle, de haute qualité et facilement accessibles, spécifiquement conçus pour les contextes médicaux et soumis à des contraintes anatomiques et cliniques strictes, a considérablement freiné l’avancement de ce domaine. Pour combler cette lacune, nous introduisons Med-Banana-50K, un jeu de données complet comprenant plus de 50 000 éditions d’images soigneusement validées du point de vue médical, couvrant des radiographies thoraciques, des IRM cérébrales et des photographies de fond d’œil, pour 23 affections différentes. Chaque échantillon permet une édition bidirectionnelle des lésions (ajout et suppression) et a été construit à l’aide du modèle Gemini-2.5-Flash-Image à partir d’images cliniques réelles. Un élément distinctif de notre jeu de données réside dans son protocole de contrôle qualité fondé sur des critères médicaux : nous utilisons un cadre d’évaluation par « juge LLM » (modèle linguistique à grande échelle), évaluant notamment la conformité aux instructions, la plausibilité structurelle, la réalisme visuel et la préservation de la fidélité, accompagné d’un processus itératif de raffinement pouvant atteindre jusqu’à cinq itérations. En outre, Med-Banana-50K inclut environ 37 000 tentatives d’édition infructueuses, accompagnées de logs complets d’évaluation, afin de soutenir la recherche en apprentissage par préférence et en alignement des modèles. En proposant une ressource à grande échelle, rigoureusement médicale et entièrement documentée, Med-Banana-50K établit une base fondamentale critique pour le développement et l’évaluation de systèmes fiables d’édition d’images médicales.