17일 전

독립 테스트 코호트의 ECG를 기반으로 LLM을 사용하여 환자의 연령을 예측하기 위한 심층 합성 신경망의 활용

{Belal Tavashi, Bjørn-Jostein Singstad}
독립 테스트 코호트의 ECG를 기반으로 LLM을 사용하여 환자의 연령을 예측하기 위한 심층 합성 신경망의 활용
초록

심전도는 심혈관 질환을 평가하는 데 가장 널리 사용되는 방법 중 하나이다. 그러나 최근 10년간 심전도(ECG)에서 전통적인 진단을 넘어서는 정보를 추출할 수 있는 깊은 합성곱 신경망(Convolutional Neural Network, CNN)의 가능성이 입증되었다. 예를 들어, 사람의 연령을 예측하는 것과 같은 새로운 응용이 가능해졌다. 본 연구에서는 공개 데이터셋을 활용하여 1차원 CNN 두 가지 모델을 훈련시켜 개인의 심전도를 바탕으로 연령을 예측하는 것을 목표로 하였다.모델은 10초 길이의 12개 리드 심전도 기록을 100Hz로 재샘플링하여 훈련 및 검증에 사용하였다. 훈련 및 교차검증에는 총 59,355건의 심전도 데이터가 사용되었으며, 별도의 코호트에서 수집된 21,748건의 심전도 데이터는 테스트 세트로 활용되었다. 우리는 교차검증 성능과 테스트 세트 성능을 비교하였으며, 또한 심장내과 전문의가 주석을 달아 분류한 심혈관 질환 정보를 활용하여 테스트 세트의 환자들을 분류함으로써, 특정 심혈관 질환이 CNN을 통한 예측 연령과 생물학적 연령 간의 차이를 더 크게 유도하는지 여부를 평가하였다.가장 우수한 성능을 보인 CNN 모델은 Inception Time 아키텍처를 기반으로 하였으며, 평균 절대 오차(Mean Absolute Error, MAE) 측면에서 교차검증 결과(7.90 ± 0.04년)에서 테스트 세트 성능(8.3년)으로 유의미한 성능 저하가 관찰되었다. 반면, 평균 제곱 오차(Mean Squared Error, MSE)는 훈련 세트(117.5 ± 2.7년²)에서 테스트 세트(111년²)로 개선되었다. 또한 MAE 기준으로 예측 연령과 생물학적 연령 간의 차이가 가장 큰 심혈관 질환은 패싱 리듬을 가진 환자(10.5년)였으며, 반면 긴 QT 간격을 가진 환자 그룹은 MAE 기준으로 가장 작은 차이(7.4년)를 보였다.본 연구는 심전도를 기반으로 한 깊은 CNN을 활용한 연령 예측에 관한 기존 지식을 확장하며, 훈련에 사용된 코호트와 다른 코호트에서의 테스트 세트에 대한 모델의 성능을 실증적으로 제시함으로써, 모델의 일반화 능력과 임상적 적용 가능성에 대한 통찰을 제공한다.