HyperAIHyperAI

Command Palette

Search for a command to run...

유방암: 다중 모달 융합 데이터셋

날짜

12일 전

게시 URL

www.kaggle.com

라이선스

CC BY 4.0

유방암: 멀티모달 융합 데이터셋은 침습성 유방암(BRCA) 환자를 위해 구축된 전처리된 멀티모달 데이터셋입니다. 이 데이터셋은 멀티모달 융합 네트워크 구축을 위한 간편한 기반을 제공하는 것을 목표로 하며, 멀티모달 융합 모델링, 방사선영상학, 생존 예측, 맞춤형 치료 분석 등 다양한 연구 분야에서 널리 활용되고 있습니다. 이 데이터 세트는 122명의 BRCA 변이 환자로부터 얻은 다양한 출처의 데이터를 엄격하게 정렬합니다. 모든 샘플은 TCGA 사례 ID를 사용하여 다양한 영상 모달리티에 걸쳐 매핑되었으며, 이를 통해 거시적 의료 영상(MRI), 미시적 디지털 병리(조직병리), 다중 오믹스 데이터 및 임상 치료 정보 간에 일대일 대응 관계를 구축했습니다. 데이터는 CSV 파일, 병리학적 패치 이미지 및 매핑 파일 형식으로 구성되어 있습니다.

데이터 구성

시각 방식

  • MRI 스캔(mri_processed): 종양 구조 및 영상 특징 연구에 사용되는 전처리된 유방 MRI 이미지.
  • 조직병리 슬라이드(SVS_patches): 전체 슬라이드 이미지(WSI)에서 추출한 고해상도 병리 슬라이드 패치로, CNN 및 Vit와 같은 시각 모델 학습에 직접 사용할 수 있습니다.
  • 조직 매핑 파일(MRI_and_SVS_Patches_index.json)은 병리학적 부위와 환자 간의 매핑 관계를 설정하는 데 사용되며, 이를 통해 PyTorch 또는 TensorFlow 데이터 로더를 쉽게 구축할 수 있습니다. 멀티오믹스
  • 전사체 분석(RNA_RAW.csv): 표준화된 RNA-Seq 유전자 발현 데이터
  • 유전자 복제 수 변이(CNV_RAW.csv): 유전자 복제 수 변이(CNV)의 증폭 및 결실 특성
  • 융합 오믹스 특징(RNA_CNV_ModelReady.csv): RNA 및 CNV 데이터를 포함하는 표준화된 특징 파일로, 신경망의 입력으로 직접 사용할 수 있습니다.
  • 체세포 돌연변이 데이터(Mutations_Dataset.csv): 환자별로 집계된 체세포 돌연변이 유전자 목록입니다. 임상 및 치료 데이터
  • 임상 치료 데이터(Clinical_Treatment_Data.csv): 정제된 임상 및 치료 데이터 파일
  • 임상 필드에는 인구 통계 정보, 생존 상태(vital_status) 및 TNM 병리학적 병기가 포함됩니다.
  • 약물 코딩 매트릭스: Drug_Tamoxifen 및 Drug_Paclitaxel과 같은 약물에 대한 원핫 코딩 기능을 제공하며, 이는 치료 요법과 환자 예후 간의 상관관계 분석에 사용됩니다.

소환

암 유전체 지도 유방 침습성 암(TCGA-BRCA) 데이터 수집. TCGA-BRCA 프로젝트에 속하는 유전체 및 임상 데이터는 GDC 데이터 포털에서 가져왔습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp