HyperAIHyperAI

Command Palette

Search for a command to run...

Brustkrebs: Multimodaler Fusionsdatensatz

Datum

vor 16 Stunden

Veröffentlichungs-URL

www.kaggle.com

Lizenz

CC BY 4.0

Breast Cancer: Multi-Modal Fusion ist ein vorverarbeiteter multimodaler Datensatz, der für Patientinnen mit invasivem Brustkrebs (BRCA) entwickelt wurde. Er dient als sofort einsatzbereite Grundlage für den Aufbau multimodaler Fusionsnetzwerke und findet breite Anwendung in Forschungsszenarien wie multimodaler Fusionsmodellierung, Radiomics, Überlebensprognose und personalisierter Therapieanalyse. Dieser Datensatz verknüpft präzise Daten aus verschiedenen Quellen von 122 BRCA-Patientinnen. Alle Proben wurden mithilfe der TCGA-Fall-IDs modalitätsübergreifend zugeordnet, wodurch eine eindeutige Korrespondenz zwischen makroskopischer Bildgebung (MRT), mikroskopischer digitaler Pathologie (Histopathologie), Multi-Omics-Daten und klinischen Behandlungsinformationen erreicht wurde. Die Daten liegen in Form von CSV-Dateien, pathologischen Patch-Bildern und Mapping-Dateien vor.

Datenzusammensetzung

Sehmodalität

  • MRI-Scan (mri_processed): Vorverarbeitete Brust-MRT-Bilder, die zur Untersuchung der Tumorstruktur und der Bildgebungsmerkmale verwendet wurden.
  • Histopathologische Präparate (SVS_patches): Hochauflösende pathologische Präparatausschnitte, die aus Whole Slide Images (WSIs) extrahiert wurden und direkt zum Trainieren visueller Modelle wie CNN und Vit verwendet werden können.
  • Die Gewebezuordnungsdatei (MRI_and_SVS_Patches_index.json) dient dazu, die Zuordnungsbeziehung zwischen pathologischen Bereichen und Patienten herzustellen und so die Erstellung von PyTorch- oder TensorFlow-Datenladern zu erleichtern. Multi-Omics
  • Transkriptomik (RNA_RAW.csv): Standardisierte RNA-Seq-Genexpressionsdaten
  • Kopienzahlvarianten (CNV_RAW.csv): Amplifikations- und Deletionscharakteristika von Kopienzahlvarianten (CNVs)
  • Fusion-Omics-Features (RNA_CNV_ModelReady.csv): Eine standardisierte Feature-Datei, die RNA- und CNV-Daten enthält und direkt als Eingabe für ein neuronales Netzwerk verwendet werden kann.
  • Daten zu somatischen Mutationen (Mutations_Dataset.csv): Eine Liste der somatisch mutierten Gene, aggregiert nach Patient. Klinische und Behandlungsdaten
  • Klinische Behandlungsdaten (Clinical_Treatment_Data.csv): Bereinigter Datensatz mit klinischen und Behandlungsdaten
  • Zu den klinischen Feldern gehören demografische Informationen, der Überlebensstatus (vital_status) und das TNM-pathologische Stadium.
  • Arzneimittelkodierungsmatrix: Bietet One-Hot-Codierungsmerkmale für Arzneimittel wie Drug_Tamoxifen und Drug_Paclitaxel, die für Korrelationsanalysen zwischen Behandlungsregimen und Patientenprognose verwendet werden.

Zitat

Die Cancer Genome Atlas Breast Invasive Carcinoma (TCGA-BRCA) Datensammlung. Genomische und klinische Daten, die vom GDC-Datenportal des TCGA-BRCA-Projekts abgerufen wurden

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp