프랑스 연구팀은 11,647건의 임상 데이터를 기반으로 기계 학습을 사용하여 간세포암 간 이식 환자의 이중 사망 위험을 정확하게 예측하는 데 처음으로 성공했습니다.

5달 전

간암은 초기에는 증상이 뚜렷하지 않고 진행 속도가 빨라 오랫동안 '암의 왕'으로 불려 왔습니다. 그중에서도 간세포암(HCC)은 가장 흔한 유형의 간암으로, 원발성 간암의 701~901%를 차지합니다. 환자들은 대개 초기 단계에서 간 이식을 통해 완치 치료를 받으며, 이는 많은 HCC 환자들에게 삶의 희망을 놓지 않는 마지막 '생명줄'이기도 합니다.

그러나 기증 장기의 극심한 부족으로 인해 이러한 생명의 희망은 더욱 소중해집니다. 더욱 어려운 점은 간세포암(HCC) 간 이식 대기자들이 간부전과 종양 진행으로 인한 사망이라는 이중고에 끊임없이 직면한다는 사실입니다. 이 두 가지 요인은 서로 얽혀 있고 상호 영향을 미치며, 대기 기간 동안 사망 위험을 크게 증가시킵니다. 따라서간세포암 환자의 간 이식 대기 기간 동안 사망 위험을 정확하게 평가하는 것은 간 이식 대기자 명단의 우선순위를 최적화하고 부족한 기증자를 공정하게 배분하는 데 핵심적인 요소일 뿐만 아니라, 모든 환자를 효율적으로 살리고 어렵게 얻은 생명의 희망을 지키는 데 있어 중요한 과제입니다.

이전에는 Child-Pugh, Albumin-Bilirubin(ALBI), Model for End-Stage Liver Disease(MELD)와 같은 전통적인 위험 평가 방법이 간 질환 위험 평가에 널리 사용되었습니다. 그러나 이러한 방법들은 HCC 환자의 복잡한 상황에 직면했을 때 상당한 한계를 보였습니다. 즉, 간 기능 및 간경변 정도 평가에만 초점을 맞추거나 종양 진행 예측에만 초점을 맞추어 두 가지 위험을 동시에 고려하지 못했습니다. 이후 HALT-HCC 및 Mehta 모델과 같이 두 가지 위험을 동시에 고려할 수 있는 포괄적인 점수 시스템이 개발되었지만,또한, 선형 모델의 한계, 고정된 변수 가중치, 그리고 단일 시점에서의 정적 측정으로 인해 질병의 역동적인 진행 과정에서 영향 요인과 위험 변화 간의 상호작용을 포착하는 것이 불가능하여 정확한 개별 위험 평가를 달성하기 어렵습니다.

이러한 임상적 문제점에 대한 대응으로,프랑스의 텔레콤 쉬드-파리와 파리-사클레 대학교의 연구팀이 앙상블 학습(EL)과 샤펠 가산 설명(SHAP) 분석을 통합한 기계 학습 프레임워크를 제안했습니다.본 연구는 간세포암(HCC) 간 이식 후보자의 사망 위험을 평가하는 새로운 접근법을 제시합니다. 11,647명의 환자 임상 데이터를 기반으로 랜덤 포레스트(RF), XGBoost, LightGBM의 세 가지 앙상블 모델을 비교 분석했습니다. 또한, SHAP 값을 UMAP(Uniform Manifold Approximation and Projection) 저차원 공간에 임베딩하고 K-medoids 알고리즘을 활용한 지도 클러스터링을 통해 간 기능 장애와 종양 진행이 HCC 환자의 사망에 있어 두 가지 핵심 위험 요인임을 규명했습니다.

본 연구는 특히 이중 위험 요인이 있는 연구에서 HCC 간 이식 후보자를 정확하게 평가하기 위한 기존 기계 학습 모델의 공백을 메웁니다.본 연구는 간세포암 환자의 간 이식 대기 기간 3개월 동안의 사망률을 정확하게 예측하고 임상적으로 해석할 수 있도록 함으로써, 간 이식을 받는 간세포암 환자의 임상적 의사 결정 및 위험 계층화를 위한 새로운 도구를 제공한다.

"간세포암이 있는 간 이식 후보자의 설명 가능한 사망률 예측: 지도 학습 클러스터링 접근법"이라는 제목의 이 연구 결과는 Health Data Science에 게재되었습니다.

연구 하이라이트:

* 본 연구는 머신러닝 모델을 활용하여 간세포암 환자의 간 이식 대기자 명단에 있는 환자의 사망 위험을 심층적으로 분석한 최초의 종합적인 연구입니다.

* SHAP + UMAP + K-medoids를 사용하여 임상적으로 설명 가능한 7개의 위험 하위 그룹을 분류하여 이중 위험의 핵심 원인을 파악했습니다.

* 8가지 핵심 변수에 대한 SHAP 선별을 기반으로 구축된 새로운 위험 점수 ELM-HCC는 기존 점수보다 훨씬 뛰어난 예측 정확도를 보여줍니다.

* 본 연구는 간세포암 환자의 간 이식 대기 기간 동안 사망률을 예측하는 주요 지표로서 이러한 변수(예: AFP_DIFF)의 역할을 규명함으로써, 간세포암 환자의 간 이식 대기 기간 동안의 위험 평가에 핵심적인 동적 변수들을 포함시킨 최초의 연구입니다.

서류 주소:

https://spj.science.org/doi/10.34133/hds.0295
저희 공식 위챗 계정을 팔로우하시고 백그라운드에서 "간 이식"이라고 답장하시면 전체 PDF 파일을 받으실 수 있습니다.

최첨단 AI 논문을 더 보려면 여기를 클릭하세요.

https://hyper.ai/papers

데이터셋: 대규모 샘플 전략 + 동적 변수 소개

혼란 요인을 줄이기 위해,본 연구는 공개 데이터베이스 데이터를 기반으로 한 대규모 표본 추출 전략을 활용했다.

구체적으로, 본 연구 데이터는 장기 조달 및 이식 네트워크(OPTN)와 장기 공유 연합 네트워크(UNOS)의 표준 이식 분석 및 연구(STAR) 파일에서 가져왔으며, 2002년 2월 27일부터 2023년 9월 30일 사이에 등록된 다발성 장기 이식을 받지 않은 성인 간세포암 환자를 대상으로 합니다.

본 연구는 간세포암 환자의 간 이식 대기 기간 3개월 동안의 사망률을 예측하는 것을 목표로 하였다. 따라서 연구팀은 연구 대상자를 두 그룹으로 나누어 분석하였다.이식 대기자 명단에 3개월 이상 올라 있는 환자를 "대기자 명단에 있는 환자"라고 하며, 3개월 이내에 사망하거나 상태가 악화되어 이식을 받을 수 없게 된 환자를 "대기자 명단 사망률"이라고 합니다.결정적인,연구 대상에는 총 11,647명의 환자가 포함되었습니다.이들 중 11,199명은 대기자 명단에 있었고, 448명은 사망 대기자 명단에 있었습니다. 데이터에는 임상, 실험실 및 질병 관련 다차원 변수가 포함되었습니다.

데이터 전처리 단계에서 환자의 건강 상태의 역동적인 특성을 포착하기 위해 연구팀은 혈청 나트륨, 크레아티닌, 알부민, 빌리루빈, 알파태아단백(AFP), 국제 표준화 비율(INR) 등 기존 점수 산정에 사용되는 6가지 주요 임상 변수의 연속 측정 차이(DIFF)를 계산하여 환자 건강 상태 변화의 동적 궤적을 파악했습니다.이로써 전체 특징 개수는 31개(기존 정적 변수 25개 + 새로 추가된 동적 변수 6개)로 늘어납니다.

결측값 처리를 위해 수치형 변수(결측률 < 7%)는 해당 범주의 평균값을 사용하여 대체하였고, 범주형 변수(결측률 < 0.1%)는 결측값이 포함된 관측치를 직접 삭제하였다.

모델 아키텍처: 엔드투엔드 통합 프로세스 + 여러 앙상블 학습 모델 비교

간세포암 환자의 간 이식 대기 기간 3개월 동안의 사망률 예측의 신뢰성과 정확성, 그리고 해석 가능성을 확보하기 위해,연구팀은 앙상블 학습, SHAP 해석 가능성 분석, UMAP 차원 축소 및 K-Medoids 지도 클러스터링을 결합한 통합 프로세스를 구축했습니다.다음 그림과 같이:

간세포암종 간 이식 후보자의 사망 위험 평가 및 계층화를 위한 워크플로우

첫째, 핵심 모델은 앙상블 학습 트리 모델을 사용합니다.이러한 유형의 모델은 특히 표 형식의 이질적인 데이터를 처리하는 데 효과적입니다. 이러한 모델의 성능을 더욱 자세히 비교하기 위해 본 연구에서는 랜덤 포레스트, XGBoost, LightGBM이라는 세 가지 기본 앙상블 학습 모델을 사용했습니다. 실험은 두 가지 훈련 시나리오에서 수행되었습니다. 첫 번째 시나리오에서는 25개의 정적 변수만 사용했고, 두 번째 시나리오에서는 동적 변수를 포함하여 31개의 정적 및 동적 변수를 결합했습니다.

둘째로, 해석 가능성의 목적은 예측 결과에 대한 과학적이고 합리적인 해석을 제공함으로써 임상 의사결정의 근거를 강화하는 데 있습니다.이를 위해 연구팀은 SHAP 해석 가능성 분석을 프레임워크에 통합하여 주요 위험 요인을 파악하고 모델 예측을 밝혀냈습니다.

전역적 해석을 위해 SHAP 값을 계산하면 각 특징이 모델 예측 결과에 미치는 영향을 정량화하여 사망 예측의 핵심 위험 요인을 파악하고 특징과 사망 위험 간의 상관관계를 명확히 할 수 있습니다. 지역적 해석을 위해서는 SHAP 요약 그래프와 SHAP 힘 그래프를 통해 개별 특징 값이 예측 결과에 미치는 구체적인 영향과 각 환자에 대한 특징 기여도 분포를 확인할 수 있습니다. 또한, 이 단계는 후속 클러스터 분석을 위한 SHAP 값 특징 집합을 제공하여 원본 데이터를 대체하고 클러스터링 결과의 임상적 해석 가능성을 향상시킵니다.

마지막으로, 환자에 대한 더욱 정교한 위험 계층화를 달성하기 위해 초점은 인구 수준의 예측에서 하위 그룹별 분석으로 옮겨갔습니다.본 연구 과정에는 UMAP 차원 축소 및 K-Medoids 지도 클러스터링 방법이 활용되었습니다.먼저, 예측된 SHAP 값들을 차원 축소된 UMAP 공간에 임베딩합니다. 그런 다음, K-Medoids 알고리즘을 사용하여 3차원 UMAP 공간에 임베딩된 SHAP 값들을 클러스터링함으로써 임상적 특성이 다른 잠재적 환자 하위 그룹을 찾아냅니다. 이 방법은 원본 데이터가 아닌 SHAP 값을 기반으로 클러스터링을 수행하기 때문에 "지도 클러스터링"이라고 합니다.

최적의 클러스터 개수는 실루엣 계수 및 데이비스-볼딘 지수와 같은 정량적 지표를 이용한 1차 선별 후, SHAP 분석을 통해 클러스터링 특성을 임상적으로 검증함으로써 결정되었다. 최종적으로 최적의 클러스터 개수는 7개로 결정되었다.

실험 결과: 새로운 모델은 비교를 위해 8가지 기존 평가 방법과 최적의 특징 집합을 사용하여 학습되었습니다.

위험 점수 성능 비교

본 연구는 제안된 프레임워크의 성능을 ALBI, Child–Pugh, AFP, HCC에 대한 LT 관련 위험(HALT-HCC), Mehta 모델, MELD 및 그 두 가지 변형인 MELD-Na와 MELD 3.0을 포함한 8가지 기존 위험 평가 방법과 비교합니다.

데이터셋의 심각한 클래스 불균형을 고려하여, 본 연구에서는 다수 그룹(대기자 명단)을 다운샘플링하여 소수 그룹(대기 기간 중 사망자)과 유사한 크기의 30개 하위 집합을 생성했습니다. 각 균형 하위 집합에 대해 3겹 교차 검증을 수행하여 동일 환자의 모든 관측치가 훈련 또는 테스트 세트에 할당되도록 했습니다. 그런 다음 아래 그림과 같이 그리드 탐색을 사용하여 세 가지 앙상블 모델에 대한 최적의 하이퍼파라미터 구성을 결정했습니다.

결과는 다음과 같습니다기존 평가 시스템에서 메타 모델은 AUROC 0.782로 가장 우수한 성능을 보였으며, 그 다음으로 HALT-HCC가 AUROC 0.763으로 뒤를 이었습니다.더욱 중요한 것은 이 두 모델이 민감도와 특이도 측면에서 보다 균형 잡힌 성능을 제공한다는 점입니다. MELD 3.0은 기본 MELD 및 MELD-Na 모델보다 우수한 성능을 보이지만, 민감도와 특이도 측면에서 불균형을 보입니다.

실험을 앙상블 학습 프레임워크로 확장했을 때, 25개의 정적 변수로 학습된 모든 모델의 정확도가 기존 점수 시스템보다 우수했습니다. 랜덤 포레스트(RF) 모델이 AUROC 0.796으로 가장 우수한 성능을 보였으며, 민감도 72.41%와 특이도 75.24% 또한 균형이 잘 잡혀 있었습니다. 31개의 동적 및 정적 변수를 결합하여 도입한 후에는 모든 앙상블 학습 모델의 성능이 더욱 향상되었습니다.LightGBM은 AUROC 0.826과 최고 민감도 77.42%를 달성하여 고위험 환자를 식별하는 데 가장 효과적인 모델이 되었습니다.

주요 위험 요인을 식별하는 능력 분석

모델 학습 후, 연구팀은 가장 관련성이 높은 특징만을 사용하여 성능을 평가할 것입니다. 이를 위해 연구팀은 Gain 중요도와 SHAP 전역 중요도라는 두 가지 특징 중요도 평가 방법을 사용하여 최적의 성능을 보이는 LightGBM 모델에 대한 핵심 특징을 선별했습니다.

LightGBM 모델(최고 성능 모델)을 기반으로 SHAP 전역 중요도를 사용하여 선택된 상위 8개 특징은 최적의 모델 성능을 달성합니다.AUROC 0.835, 민감도 77.141 TP3T, 특이도 75.641 TP3T를 나타낸 이 특징 집합은 Gain importance screening 결과(8개 특징 사용 시 AUROC 0.812, 12개 특징 사용 시 최고치 0.828)를 능가했을 뿐만 아니라, 31개 변수 전체를 사용한 LightGBM의 성능(AUROC 0.826)보다도 우수했습니다. 따라서 연구팀은 이 특징 집합을 최적의 특징 집합으로 선정했습니다.

SHAP 전역 중요도 필터링을 사용한 LightGBM 모델의 특징 중요도 순위

궁극적으로, 본 연구는 최적의 특징 집합으로 학습된 LightGBM 모델을 기반으로 HCC 환자의 확률적 사망률 점수인 ELM-HCC를 개발하고 구축했습니다. 여기서 주목할 만한 점은...LightGBM은 전체 31개 변수 세트보다 단순화된 변수 세트에서 AUROC 값이 더 우수했으며, 이는 선택된 8개 변수가 더 강력한 예측력을 가지고 있음을 보여줍니다.한편, 주요 관련 특징에서 AFP_DIFF가 나타나는 것은 동적 정보를 통합하는 것이 중요하다는 점을 강조합니다.

위험 계층화 및 하위 그룹 분석

본 연구에서는 SHAP 값을 이용한 지도형 클러스터링을 통해 임상적 특성과 위험 수준이 서로 다른 7개의 환자 하위 그룹을 식별했습니다. 아래 그림 B는 클러스터 1에서 클러스터 7로 갈수록 사망 확률이 점진적으로 증가하는 계층화된 사망률 분석 결과를 명확하게 보여줍니다.

A는 SHAP 임베딩 값을 기반으로 하는 UMAP 2D 시각화 클러스터입니다.
B는 7개의 군집 관측치에 대한 사망 확률의 상자 그림과 모집단 그림을 나타냅니다.

크루스칼-월리스 검정을 기반으로 한 추가 분석 결과, 각 클러스터 간 변수에서 차이가 나타났습니다. SHAP 도표에서 볼 수 있듯이, 사망 확률은 클러스터 1에서 클러스터 7로 갈수록 점진적으로 증가했습니다. 예를 들어, 대표 환자의 사망 확률은 0.03에서 0.98로 증가했습니다.이러한 경향은 박스 플롯에서 관찰된 순위와 일치하며, 클러스터링 방법의 효과성을 강조합니다.

또한, 하위 그룹 분석을 통해 사망 위험이 높은 두 가지 주요 원인이 명확히 밝혀졌습니다. 하나는 심각한 간부전(높은 빌리루빈 수치, 높은 크레아티닌 수치, 중등도의 복수가 특징이며, 이 모든 증상은 SHAP 수치 양성에 해당하고 사망 위험을 크게 증가시킵니다)이고, 다른 하나는 활발한 종양 진행(높은 AFP 수치가 특징입니다)입니다.

요약하자면, 본 연구에서 제안한 LightGBM 및 SHAP 해석 가능성 분석 기반의 ELM-HCC 머신러닝 프레임워크는 간세포암 환자의 간 이식 대기 3개월 동안의 사망 위험을 예측하는 데 있어 기존의 점수 시스템보다 훨씬 우수한 성능을 보였다. 또한, 지도형 클러스터링을 통해 위험 특성이 다른 환자 하위 그룹을 식별하여 임상 의사결정을 위한 보다 정확하고 해석 가능한 위험 평가 도구를 제공한다.

간 이식 후보자 위험 평가를 위한 혁신적인 방법; 포괄적인 접근 방식이 연구의 공백을 메웁니다.

앞서 언급했듯이 간암은 전 세계적인 공중 보건 문제로 대두되고 있습니다. 질병의 심각성이 점점 커지고 의료 수요가 증가함에 따라, 과학적으로 타당하고 합리적인 간 이식 대기자 명단 작성 계획은 매우 중요합니다. 2002년부터 말기 간질환 모델(MELD)이 간 이식 대기자 우선순위 결정에 사용되어 왔지만, 여러 차례 개정에도 불구하고 MELD 배분 방식은 여전히 모든 대기자를 공정하게 만족시키지 못하고 있습니다.

고차원적이고 다양한 형태의 데이터를 처리할 수 있는 머신러닝은 이제 장기 이식 대기자의 사망 위험을 예측하는 데 가장 적합한 해결책으로 자리 잡았습니다.

머신러닝 모델은 이전에도 간 이식 사망률 예측에 적용된 바 있다. 예를 들어, MIT, 샌프란시스코 캘리포니아 대학교, 텍사스 대학교의 공동 연구팀은 최적 분류 트리(OCT)를 기반으로 하는 사망률 최적화 예측 모델인 OPOM을 제안했다.이 간 할당 모델을 기반으로 할 때, MELD 모델과 비교하여 연간 사망자 수를 약 418명 줄일 수 있으며, 모든 UNOS 지역 및 질병 중증도 수준에서 사망/제거 건수가 크게 감소합니다.또한, 이 모델은 간세포암 환자와 비환자에게 할당되는 간의 수를 조정하여 간 이식 할당을 크게 최적화하고 이식 대기자의 사망률을 감소시켰습니다.

학위논문 제목: 간 이식 대기 환자의 사망률을 예측하는 최적화된 모델의 개발 및 검증
서류 주소:

https://www.sciencedirect.com/science/article/pii/S1600613522090335

하지만 OPOM은 우수한 성능을 보였지만, 이 모델은 간세포암 환자와 비간세포암 환자가 혼합된 코호트를 기반으로 하며, 간세포암 환자가 직면하는 간부전과 종양 진행이라는 두 가지 위험을 구체적으로 다루지 않습니다. ELM-HCC는 이러한 공백을 확실히 메워줍니다.

결론적으로, 본 연구는 기존 연구를 개선하고 확장했을 뿐만 아니라, 저자들이 언급했듯이 현재 연구의 공백을 메운다는 점에서 더욱 중요합니다. 간세포암 환자의 간 이식 대기 기간 3개월 동안의 사망률을 해석 가능하고 정확하게 예측한 최초의 연구로서, 머신러닝과 장기 이식 후보자 위험 평가를 결합한 새로운 접근 방식을 제시합니다.

참고문헌:
1. 프랑스의 텔레콤 쉬드-파리와 파리-사클레 대학교의 연구팀은 앙상블 학습과 SHAP(SHAple Additive exPlanations) 분석을 통합한 머신러닝 프레임워크를 제안하여 간세포암(HCC) 간 이식 후보자의 사망 위험을 평가하는 새로운 솔루션을 제시했습니다.

2.https://www.sciencedirect.com/science/article/pii/S1600613522090335