Command Palette
Search for a command to run...
Cancer Du Sein : Ensemble De Données De Fusion Multimodale
Date
URL de publication
Licence
CC BY 4.0
Cancer du sein : Fusion multimodale est un jeu de données multimodal prétraité, conçu pour les patientes atteintes d’un cancer du sein invasif (BRCA). Il vise à fournir une base simple d’utilisation pour la construction de réseaux de fusion multimodale et est largement utilisé dans des contextes de recherche tels que la modélisation par fusion multimodale, la radiomique, la prédiction de la survie et l’analyse des traitements personnalisés. Cet ensemble de données aligne rigoureusement des données multi-sources provenant de 122 patientes atteintes d'une mutation BRCA. Tous les échantillons ont été mis en correspondance entre les différentes modalités d'imagerie grâce aux identifiants de cas TCGA, établissant ainsi un lien univoque entre l'imagerie médicale macroscopique (IRM), la pathologie numérique microscopique (histopathologie), les données multi-omiques et les informations relatives aux traitements cliniques. Les données sont organisées sous forme de fichiers CSV, d'images de zones pathologiques et de fichiers de correspondance.
Composition des données
Modalité visuelle
- Imagerie par résonance magnétique (IRM_traitée) : Images IRM mammaires prétraitées utilisées pour étudier la structure tumorale et les caractéristiques d’imagerie.
- Lames histopathologiques (SVS_patches) : patchs de lames pathologiques haute résolution extraits d’images de lames entières (WSI), qui peuvent être directement utilisés pour l’entraînement de modèles visuels tels que CNN et Vit.
- Le fichier de cartographie tissulaire (MRI_and_SVS_Patches_index.json) est utilisé pour établir la relation de cartographie entre les patchs pathologiques et les patients, facilitant la construction de chargeurs de données PyTorch ou TensorFlow. Multi-omiques
- Transcriptomique (RNA_RAW.csv) : Données d’expression génique RNA-Seq standardisées
- Variantes du nombre de copies (CNV_RAW.csv) : Caractéristiques d’amplification et de délétion des variantes du nombre de copies (CNV)
- Caractéristiques omiques de fusion (RNA_CNV_ModelReady.csv) : Un fichier de caractéristiques standardisé contenant des données ARN et CNV, qui peut être directement utilisé comme entrée d’un réseau neuronal.
- Données de mutation somatique (Mutations_Dataset.csv) : Liste des gènes mutés somatiquement, regroupés par patient. Données cliniques et thérapeutiques
- Données de traitement clinique (Clinical_Treatment_Data.csv) : fichier de données cliniques et de traitement nettoyé
- Les champs cliniques comprennent les informations démographiques, le statut de survie (vital_status) et le stade pathologique TNM.
- Matrice de codage des médicaments : Fournit des caractéristiques de codage one-hot pour des médicaments tels que Drug_Tamoxifène et Drug_Paclitaxel, utilisées pour l’analyse de corrélation entre les schémas thérapeutiques et le pronostic du patient.
Citation
Collecte de données sur le carcinome invasif du sein dans le cadre de l'Atlas du génome du cancer (TCGA-BRCA). Données génomiques et cliniques extraites du portail de données GDC appartenant au projet TCGA-BRCA
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.