HyperAI초신경

치매를 효과적으로 지연시키는 방법: 연세대학교, 그래디언트 부스팅 머신 모델이 BPSD 하위 증후군을 정확하게 예측할 수 있다는 것을 발견

2년 전
정보
Yinrong Huang
特色图像

내용을 한눈에 보기:인구가 계속 고령화됨에 따라 치매는 공중 보건 문제가 되었습니다. 현재 의료계에서는 이 질병을 약물로 증상을 완화하는 방식으로만 치료할 수 있으며, 효과적인 치료법은 아직 발견하지 못했습니다. 그러므로 치매를 예방하는 것이 특히 시급합니다. 이러한 배경에서 연세대학교 연구진은 BPSD를 예측하기 위한 여러 가지 머신러닝 모델을 개발하고 검증했습니다. 실험 결과는 머신 러닝이 BPSD 하위 증후군을 효과적으로 예측할 수 있음을 보여주었습니다.

키워드:치매 BPSD 기울기 부스팅 머신

본 기사는 HyperAI WeChat 공개 플랫폼에 처음 게재되었습니다~

현재 전 세계적으로 5억 5천만 명 이상이 치매를 앓고 있으며(알츠하이머병이 가장 흔한 유형), 매년 약 1천만 명의 새로운 환자가 발생하고 있습니다.인구가 계속해서 고령화됨에 따라, 이 숫자는 2050년까지 세 배로 늘어날 것으로 예상됩니다. 치매는 사람의 기억력, 사고력, 추론 능력이 서서히 감소하는 뇌 질환입니다. 이 질병은 주로 노인에게 영향을 미치며 노인의 독립성 상실의 주요 원인 중 하나입니다. 전 세계 주요 사망 원인 중 7위를 차지하며(사망자 수 기준), 상위 3개 사망 원인은 허혈성 심장병, 뇌졸중, 만성 폐쇄성 폐질환입니다.

일반적으로 치매 환자는 인지 장애 외에도 불안, 공격성, 무관심, 우울증 등 다양한 행동 및 심리적 증상(BPSD)을 나타냅니다.이러한 증상은 치매 치료에 있어서 가장 복잡하고 어려운 문제입니다. 이러한 질환은 환자가 독립적으로 생활하는 것을 방해할 뿐만 아니라 간병인에게도 상당한 부담을 줍니다.

최근, 한국 연세대학교의 조은희 연구진은 BPSD를 예측하기 위한 여러 가지 머신 러닝 모델을 개발하고 검증했습니다.이 연구는 "치매의 행동 및 심리적 증상 발생에 대한 머신러닝 기반 예측 모델: 모델 개발 및 검증"이라는 제목으로 Scientific Reports 저널에 게재되었습니다.

   연구 결과는 Scientific Reports에 게재되었습니다.

서류 주소:

https://www.nature.com/articles/s41598-023-35194-5

데이터세트

이 연구에서는 187명의 치매 환자의 정보를 모델 훈련에 사용하고, 다른 35명의 환자의 정보를 외부 검증에 사용하여 3개 배치로 데이터를 수집했습니다. 두 번째 자료 수집은 첫 번째 자료 수집에 참여한 참가자들을 반복하여 측정하였고, 세 번째 자료 수집에서는 측정을 위해 새로운 참가자들을 모집하였습니다. 연구에서는첫 번째와 두 번째에 수집된 데이터는 훈련 세트로 사용되고, 세 번째에 수집된 데이터 세트는 테스트 세트로 사용됩니다.

참가자의 포괄적인 특성 정보를 수집하기 위해,연구진은 먼저 질병 발병 전의 건강 데이터(나이, 성별, 결혼 여부 등)와 성격 유형을 조사했습니다(한국형 빅파이브 성격검사 BFI-K).둘째, 활동기록계를 사용하여 야간 수면과 활동 수준을 모니터링했으며, 마지막으로 증상 일기를 사용하여 간병인이 감지한 증상 유발 요인(배고픔/갈증, 배뇨/배변, 통증, 불면증, 소음 등)과 환자에게서 매일 발생하는 12가지 BPSD를 기록했습니다. 또한,이러한 증상 역시 7개의 하위 증후군으로 나뉜다.아래 그림은 신체 활동 기록기와 증상 일기 데이터의 기록을 시각적으로 표현한 것입니다.

표 1:신체 활동 기록기 및 증상 일기 통계

SD:표준 편차

TST:총 수면 시간

와소:잠든 후 일어나는 시간

아니요:깨어난 횟수

말:일어나는 시간

MET:대사 당량

MVPA:중간 정도에서 격렬한 신체 활동

BPSD:치매의 행동 및 심리적 증상

다른 이유:보호자가 인지하는 기타 BPSD 유발 요인(치료, 악몽 등)

그러나 참가자의 비준수나 기기의 부적절한 착용 등의 이유로 활동 기록기 데이터가 누락되었습니다. 통계에 따르면, 데이터가 누락된 사람은 전체 참여자 중 36%였으며, 1인당 평균 0.9일 동안 데이터가 누락되었습니다. 그러므로,이러한 누락된 데이터를 처리하기 위해 연쇄 방정식을 사용하여 다변량 추정이 적용되었습니다.

실험 절차

연구자들은 각 하위 증후군을 예측하는 데 가장 적합한 모델을 결정하기 위해 4가지 모델을 훈련했습니다. 연구자들은 이러한 연구 결과를 바탕으로 이러한 모델을 BPSD 하위 증후군의 임상적 모니터링과 예측에 적용할 수 있을 것으로 보인다.동시에, BPSD에 영향을 미치는 잠재적 요인에 대한 개입을 실시하여 환자 중심의 치매 치료 서비스를 제공합니다. 또한, 머신 러닝 알고리즘을 스마트폰 애플리케이션에 내장하여 그 가치를 더욱 높일 수 있습니다.

모델 성능 

연구진은 로지스틱 회귀, 랜덤 포레스트, 그래디언트 부스팅 머신, 지원 벡터 머신을 포함한 4가지 머신 러닝 알고리즘을 사용했습니다.각각의 고유한 학습 알고리즘을 통해 모델 성능을 평가했으며, BPSD 하위 증후군을 예측하는 데 가장 적합한 모델이 선택되었습니다.여기서 로지스틱 회귀 모델은 가장 일반적이고 성숙되어 있어 머신 러닝의 성능 향상을 판단하는 벤치마크 모델로 사용됩니다.

학습 세트를 기반으로 5겹 교차 검증을 통해다음 그림은 BPSD 하위 증후군을 예측하는 다양한 모델의 성능을 보여줍니다.

표 2: 훈련 세트를 기반으로 BPSD 하위 증후군을 예측하는 다양한 모델의 성능

AUC:ROC 곡선 아래의 면적

LR:로지스틱 회귀 모델

RF:랜덤 포레스트 모델

GBM:그래디언트 부스팅 머신 모델

SVM:지원 벡터 머신 모델

ROC 곡선:ROC(수신자 조작 특성 곡선) 곡선은 분류기의 성능을 나타내는 그래픽 도구입니다.

AUC 값:AUC(곡선 아래의 면적) 값은 ROC 곡선 아래의 면적을 나타내며 분류기 성능을 측정하는 데 사용됩니다. AUC 값이 1에 가까울수록 분류기 성능이 우수합니다.

표 2는 다음을 보여줍니다.그래디언트 부스팅 머신 모델은 ADHD(0.706), 정서 증상(0.747), 섭식 장애(0.816)를 예측하는 데 더 높은 AUC 값을 가졌습니다.지원 벡터 머신 모델은 정신 증상 예측에 있어 가장 높은 AUC 값(0.706)을 보였습니다. 랜덤 포레스트 모델은 수면과 야간 행동을 예측하는 데 가장 높은 AUC 값(0.942)을 나타냈습니다. 그리고 로지스틱 회귀 모델은 비정상적인 활동 행동(0.822)과 병적인 행복감(행복감/기쁨, 0.696)을 예측하는 데 가장 높은 AUC 값을 가졌습니다.

모델 검증 

연구자들은 외부 검증 방법을 사용하여 세 번째로 수집된 데이터 세트에 대한 모델을 검증했습니다.테스트 세트를 기반으로 BPSD 하위 증후군을 예측하는 다양한 모델의 성능은 다음 그림과 같습니다.

표 3: 테스트 데이터 세트를 기반으로 BPSD 하위 증후군을 예측하는 다양한 모델의 성능

AUC:ROC 곡선 아래의 면적

LR:로지스틱 회귀 모델

RF:랜덤 포레스트 모델

GBM:그래디언트 부스팅 머신 모델

SVM:지원 벡터 머신 모델

표 3은 다음을 보여줍니다.로지스틱 회귀 모델과 비교했을 때, 머신 러닝 모델의 성능이 더 좋습니다.. 구체적으로 대부분의 하위 증후군의 경우 랜덤 포레스트와 그래디언트 부스팅 머신 모델의 성능이 로지스틱 회귀와 지원 벡터 머신 모델의 성능보다 우수합니다. 랜덤 포레스트 모델은 ADHD(0.835), 병적인 행복감(0.968), 섭식 장애(0.888)를 예측하는 데 있어 다른 예측 모델보다 더 높은 AUC 값을 가지고 있습니다. 그래디언트 부스팅 머신 모델은 정신 증상 예측에 있어 다른 예측 모델보다 더 높은 AUC 값을 갖습니다(0.801). 지원 벡터 머신 모델은 수면과 야간 행동에서 가장 높은 AUC 값(0.929)을 나타냅니다.

연구자들은 두 차트의 정보를 결합하여 7개 하위 증후군을 예측하는 측면에서 다음과 같은 사실을 발견했습니다.그래디언트 부스팅 머신 모델은 평균 AUC 값이 가장 높아서 가장 좋은 성능을 보입니다.동시에 연구진은 테스트 데이터 세트의 표본 크기가 작을 경우 예측 성능 결과를 신중하게 추론해야 한다는 점도 상기시켰습니다.더욱 정확한 예측 결과를 얻기 위해 향후 더 큰 표본 크기를 사용하여 반복 실험을 수행하는 것이 좋습니다.

국내 성과: 치매 발병 10년 앞당겨 예측

치매 예측에 있어서 외국뿐만 아니라 중국도 괄목할 만한 성과를 거두었습니다.작년 9월, 복단대학교 화산병원 신경과 주임 의사인 유진타이 임상 연구팀이 복단대학교 뇌유사지능과학기술연구소의 펑젠펑 교수 알고리즘 팀과 정웨이 청년 연구원의 알고리즘 팀과 협력하여 UKB-DRP 치매 예측 모델을 개발했습니다.

이 모델은 개인이 앞으로 5년, 10년 또는 그 이상 안에 질병에 걸릴지 예측할 수 있습니다.모든 원인 치매와 주요 하위 유형(알츠하이머병 등)을 포함하여 초기 단계의 치매 환자를 대상으로 선별 검사를 실시합니다. 해당 연구 결과는 The Lancet의 자회사인 Electronic Clinical Medicine에 게재되었습니다.

서류 주소:

https://www.thelancet.com/journals/eclinm/article/PIIS2589-5370(22)00395-9/fulltext

이번 연구 결과는 치매 예측 분야에서 우리나라의 혁신적 역량과 과학적 연구 수준을 보여주는 사례이기도 합니다. 앞으로 더 많은 기관과 연구팀이 참여하고, 더욱 포괄적이고 다양한 데이터가 축적됨에 따라, 국내외에서 더욱 많은 협력과 진전이 있을 것으로 기대합니다.인공지능과 빅데이터 분석의 힘을 통해 우리는 치매의 예방, 치료, 관리에 더 큰 기여를 할 수 있으며, 환자와 그 가족들에게 더 많은 희망과 웰빙을 제공할 수 있습니다.