2달 전

환자 집단 그래프를 활용한 환자 수준 예측을 위한 비지도 사전 학습

Chantal Pellegrini; Anees Kazi; Nassir Navab
환자 집단 그래프를 활용한 환자 수준 예측을 위한 비지도 사전 학습
초록

事전 학습(pre-training)은 컴퓨터 비전(CV), 자연어 처리(NLP) 및 의료 영상 등 기계 학습의 다양한 분야에서 성공을 거두었습니다. 그러나 임상 데이터 분석에는 아직 충분히 탐구되지 않았습니다. 소규모 병원에서 데이터를 수집하거나 희귀 질병과 관련된 경우, 전자 의료 기록(EHR) 데이터와 라벨이 부족할 수 있습니다. 이러한 상황에서 더 큰 규모의 EHR 데이터로的事前학習을 수행하면 모델 성능을 개선할 수 있습니다.본 논문에서는 환자 결과 예측을 위해 이질적이고 다중 모드(multi-modal)인 EHR 데이터에 대해 감독되지 않은 사전 학습(unsupervised pre-training)을 적용합니다. 이 데이터를 모델링하기 위해 우리는 인구 그래프(population graphs) 위에서 그래프 딥러닝(graph deep learning)을 활용합니다. 먼저, 연속적, 이산적, 시계열 등의 EHR 데이터에서 발생하는 다양한 입력 특성 유형을 처리하도록 설계된 그래프 트랜스포머(graph transformer) 기반의 네트워크 아키텍처를 설계하여 다중 모드 데이터 융합을 개선하였습니다. 또한, 마스크 임퓨테이션(masked imputation) 기반의 사전 학습 방법을 설계하여 다른 최종 작업(end tasks)에 미세 조정(fine-tuning)하기 전에 네트워크를 사전 학습하였습니다. 사전 학습은 완전히 감독되지 않은 방식으로 이루어졌으며, 이는 미래에 유사한 모달리티와 다른 작업을 가진 큰 공개 데이터셋에서 사전 학습하는 기초를 마련하였습니다.우리는 환자 기록의 두 가지 의료 데이터셋인 TADPOLE과 MIMIC-III를 사용하여 본 방법론을 테스트하였습니다. 이들 데이터셋은 영상 및 비영상 특성을 포함하며, 다양한 예측 작업(prediction tasks)에 대한 성능 평가가 이루어졌습니다. 실험 결과, 제안된 그래프 기반 사전 학습 방법이 인구 수준에서 데이터를 모델링하는 데 도움이 되며, MIMIC-III에서는 평균 AUC(Area Under the Curve)가 4.15%, TADPOLE에서는 7.64% 개선되는 것으로 나타났습니다.

환자 집단 그래프를 활용한 환자 수준 예측을 위한 비지도 사전 학습 | 최신 연구 논문 | HyperAI초신경