HyperAIHyperAI

Command Palette

Search for a command to run...

Med-Banana-50K : Un grand jeu de données multimodales pour l'édition d'images médicales guidée par le texte

Zhihui Chen Mengling Feng

Abstract

L’édition d’images médicales est devenue une technologie essentielle, aux applications multiples dans le renforcement des données, l’interprétabilité des modèles, l’enseignement médical et la simulation thérapeutique. Toutefois, le manque de jeux de données à grande échelle, de haute qualité et facilement accessibles, spécifiquement conçus pour les contextes médicaux et soumis à des contraintes anatomiques et cliniques strictes, a considérablement freiné l’avancement de ce domaine. Pour combler cette lacune, nous introduisons Med-Banana-50K, un jeu de données complet comprenant plus de 50 000 éditions d’images soigneusement validées du point de vue médical, couvrant des radiographies thoraciques, des IRM cérébrales et des photographies de fond d’œil, pour 23 affections différentes. Chaque échantillon permet une édition bidirectionnelle des lésions (ajout et suppression) et a été construit à l’aide du modèle Gemini-2.5-Flash-Image à partir d’images cliniques réelles. Un élément distinctif de notre jeu de données réside dans son protocole de contrôle qualité fondé sur des critères médicaux : nous utilisons un cadre d’évaluation par « juge LLM » (modèle linguistique à grande échelle), évaluant notamment la conformité aux instructions, la plausibilité structurelle, la réalisme visuel et la préservation de la fidélité, accompagné d’un processus itératif de raffinement pouvant atteindre jusqu’à cinq itérations. En outre, Med-Banana-50K inclut environ 37 000 tentatives d’édition infructueuses, accompagnées de logs complets d’évaluation, afin de soutenir la recherche en apprentissage par préférence et en alignement des modèles. En proposant une ressource à grande échelle, rigoureusement médicale et entièrement documentée, Med-Banana-50K établit une base fondamentale critique pour le développement et l’évaluation de systèmes fiables d’édition d’images médicales.


Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Med-Banana-50K : Un grand jeu de données multimodales pour l'édition d'images médicales guidée par le texte | Papers | HyperAI