
초록
전자 건강 기록(EHR)에서 질병 전개를 예측하는 것은 데이터의 비정상성, 의료 코드의 고해상도, 다중 모달 데이터의 통합과 같은 주요 과제로 인해 복잡한 작업이다. EHR에는 진단 코드와 같은 구조화된 데이터와 임상 노트와 같은 비구조화된 데이터가 포함되어 있으며, 후자는 종종 간과되는 핵심 정보를 담고 있다. 현재의 모델들은 주로 구조화된 데이터에 기반하고 있어 환자의 전체적인 의료적 맥락을 포착하지 못하고 있으며, 이로 인해 소중한 정보가 손실된다. 이러한 문제를 해결하기 위해, 우리는 트랜스포머 기반의 딥러닝 모델에 비구조화된 임상 노트를 통합하는 접근 방식을 제안한다. 이 통합을 통해 환자의 의료 이력 표현이 풍부해지며, 진단 예측의 정확도가 향상된다. MIMIC-IV 데이터셋을 활용한 실험 결과, 제안하는 방법이 단순히 구조화된 데이터에 의존하는 기존 모델보다 우수한 성능을 보였다.