Command Palette
Search for a command to run...
Brustkrebs: Multimodaler Fusionsdatensatz
Datum
Veröffentlichungs-URL
Lizenz
CC BY 4.0
Breast Cancer: Multi-Modal Fusion ist ein vorverarbeiteter multimodaler Datensatz, der für Patientinnen mit invasivem Brustkrebs (BRCA) entwickelt wurde. Er dient als sofort einsatzbereite Grundlage für den Aufbau multimodaler Fusionsnetzwerke und findet breite Anwendung in Forschungsszenarien wie multimodaler Fusionsmodellierung, Radiomics, Überlebensprognose und personalisierter Therapieanalyse. Dieser Datensatz verknüpft präzise Daten aus verschiedenen Quellen von 122 BRCA-Patientinnen. Alle Proben wurden mithilfe der TCGA-Fall-IDs modalitätsübergreifend zugeordnet, wodurch eine eindeutige Korrespondenz zwischen makroskopischer Bildgebung (MRT), mikroskopischer digitaler Pathologie (Histopathologie), Multi-Omics-Daten und klinischen Behandlungsinformationen erreicht wurde. Die Daten liegen in Form von CSV-Dateien, pathologischen Patch-Bildern und Mapping-Dateien vor.
Datenzusammensetzung
Sehmodalität
- MRI-Scan (mri_processed): Vorverarbeitete Brust-MRT-Bilder, die zur Untersuchung der Tumorstruktur und der Bildgebungsmerkmale verwendet wurden.
- Histopathologische Präparate (SVS_patches): Hochauflösende pathologische Präparatausschnitte, die aus Whole Slide Images (WSIs) extrahiert wurden und direkt zum Trainieren visueller Modelle wie CNN und Vit verwendet werden können.
- Die Gewebezuordnungsdatei (MRI_and_SVS_Patches_index.json) dient dazu, die Zuordnungsbeziehung zwischen pathologischen Bereichen und Patienten herzustellen und so die Erstellung von PyTorch- oder TensorFlow-Datenladern zu erleichtern. Multi-Omics
- Transkriptomik (RNA_RAW.csv): Standardisierte RNA-Seq-Genexpressionsdaten
- Kopienzahlvarianten (CNV_RAW.csv): Amplifikations- und Deletionscharakteristika von Kopienzahlvarianten (CNVs)
- Fusion-Omics-Features (RNA_CNV_ModelReady.csv): Eine standardisierte Feature-Datei, die RNA- und CNV-Daten enthält und direkt als Eingabe für ein neuronales Netzwerk verwendet werden kann.
- Daten zu somatischen Mutationen (Mutations_Dataset.csv): Eine Liste der somatisch mutierten Gene, aggregiert nach Patient. Klinische und Behandlungsdaten
- Klinische Behandlungsdaten (Clinical_Treatment_Data.csv): Bereinigter Datensatz mit klinischen und Behandlungsdaten
- Zu den klinischen Feldern gehören demografische Informationen, der Überlebensstatus (vital_status) und das TNM-pathologische Stadium.
- Arzneimittelkodierungsmatrix: Bietet One-Hot-Codierungsmerkmale für Arzneimittel wie Drug_Tamoxifen und Drug_Paclitaxel, die für Korrelationsanalysen zwischen Behandlungsregimen und Patientenprognose verwendet werden.
Zitat
Die Cancer Genome Atlas Breast Invasive Carcinoma (TCGA-BRCA) Datensammlung. Genomische und klinische Daten, die vom GDC-Datenportal des TCGA-BRCA-Projekts abgerufen wurden
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.