MedTrinity-25M Großer Multimodaler Medizinischer Datensatz
Datum
Veröffentlichungs-URL
Kategorien
Bei diesem Datensatz handelt es sich um einen groß angelegten multimodalen medizinischen Datensatz, der 2024 gemeinsam von Forschungsteams der Huazhong University of Science and Technology, der University of California, Santa Cruz, der Harvard University und der Stanford University veröffentlicht wurde. Die relevanten Ergebnisse der Studie lauten:MedTrinity-25M: Ein umfangreicher multimodaler Datensatz mit multigranularen Annotationen für die Medizin".
MedTrinity-25M enthält mehr als 25 Millionen medizinische Bilder aus 10 Bildgebungsverfahren und ist mit mehr als 65 Krankheiten versehen. Dieser Datensatz enthält nicht nur umfangreiche globale und lokale Anmerkungen, sondern integriert auch mehrstufige Informationsanmerkungen in mehreren Modalitäten (wie CT, MRT, Röntgen usw.). Zu diesen Anmerkungen gehören Krankheits- oder Läsionstyp, Bildgebungsverfahren, regionsspezifische Beschreibungen und Beziehungen zwischen Organen. Durch die Vorverarbeitung und Integration von Daten aus mehr als 90 verschiedenen Quellen entwickelte das Forschungsteam eine einzigartige automatisierte Datenkonstruktionspipeline zur Generierung mehrstufiger visueller und textueller Anmerkungen. Diese Methode durchbricht die Beschränkungen der traditionellen Verwendung von Bild-Text-Paaren und ermöglicht die automatische Generierung von Anmerkungen. Dieser Datensatz wird multimodale Aufgaben wie die medizinische Bildverarbeitung, Berichterstellung, Klassifizierung und Segmentierung hervorragend unterstützen und gleichzeitig das Vortraining medizinbasierter Modelle künstlicher Intelligenz fördern.
