HyperAI초신경

난소암은 혈액 검사, 소변 검사 및 기타 지표를 통해 발견할 수 있습니다! 중산대학 류지홍 교수팀이 주도해 4대 의대와 공동으로 AI 융합모델 구축

特色图像

국가보건위원회가 발표한 '난소암 진단 및 치료 지침(2022년판)'에 따르면, 우리나라의 난소암 연간 발생률은 여성 생식기 종양 중 자궁경부암과 자궁체부 악성 종양에 이어 3위를 차지합니다. 사망률은 여성 생식기관 악성종양 중 1위를 차지하며, 5년 생존율은 진단 당시 질병 단계와 밀접한 관련이 있습니다. 미국 국립암연구소가 발표한 자료에 따르면, 초기 국소감염기의 난소암 5년 생존율은 92.4%인 반면, 전이기의 5년 생존율은 31.5%로 낮아졌습니다.

난소는 골반강 깊숙한 곳에 위치해 있습니다. 초기 단계의 난소 병변은 종종 특별한 임상 증상이 나타나지 않습니다. 증상이 나타나고 환자가 치료를 받을 때 70% 환자는 이미 후기 단계에 들어선 상태입니다. 그러므로 난소암을 조기에 진단하는 것은 매우 중요합니다.

다양한 단계의 난소암의 5년 생존율

최근, 중산대학 암예방치료센터 산부인과 류지홍 교수 연구팀은 남부의과대학, 화중과학기술대학 통지의학원 부속 통지병원, 저장대학 의학부 부속 산부인과 병원과 협력하여 난소암의 조기 진단의 어려움과 효과적인 종양 표지자 부족이라는 현 상황을 해결하기 위한 연구를 진행했습니다.난소암 진단을 위한 인공지능 융합 모델 MCF가 구축되었으며, 일상적인 실험실 검사 데이터와 나이를 입력하여 난소암 위험도를 계산할 수 있습니다.관련 결과는 The Lancet Digital Health에 게재되었습니다.

서류 주소:
https://doi.org/10.1016/S2589-7500(23)00245-500245-5/fulltext#%20)
공식 계정을 팔로우하고 "난소암"이라고 답글을 달면 전체 논문을 받아볼 수 있습니다.

연구 하이라이트:

* 본 연구는 우리나라 3개 병원의 데이터를 수집하고 다중 기준 의사결정 분류 융합(MCF) 프레임워크를 사용하여 모델을 개발했습니다.

* 이 모델은 CA125 및 HE4와 같은 기존 바이오마커보다 난소암을 식별하는 데 더 정확합니다.

* 연구는 저렴하고 쉽게 접근 가능한 일상적인 실험실 검사가 난소암에 대한 효과적인 진단 도구가 될 수 있는 잠재력을 보여줍니다.

3개 병원, 1만 명의 환자, 98건의 관련 검사 및 데이터를 하나로 모았습니다.

연구진은 2012년 1월 1일부터 2021년 4월 4일까지 중산대학 암센터, 화중과학기술대학 통지의학원 부속 통지병원, 저장대학 의학부 부속 산부인과 병원에서 데이터를 수집했습니다.10,000명 이상의 환자(난소암과 양성 자궁 부속기 병변/정상 신체 검사 결과를 보이는 여성)의 98개 실험실 검사 결과와 임상적 특성에 대한 데이터입니다.

이 중 화중과학기술대학교 통지의과대학의 참가자 데이터(총 3,007명)를 학습 데이터셋으로 선정하고, 이 학습 데이터셋에 대해 5겹 교차 검증을 실시하였다. 두 개의 외부 검증 세트는 저장대학 의과대학 여성병원(피험자 5,641명)과 중산대학 암센터(피험자 2,344명)에서 수집되었습니다.

MCF: 20개 기본 분류 모델의 융합

연구 흐름도

이 연구는 우리나라 3개 지역에서 많은 수의 참가자를 모집했습니다. 3개 코호트에서 난소암 진단 시 중앙 연령은 51~56세였습니다. 그러나 대규모 데이터는 몇 가지 문제점도 야기합니다. 예를 들어, 다기관 데이터는 이질적이어서 견고한 AI 모델을 구축하는 데 도움이 되지 않으며, 난소암 환자 수와 대조군 참가자 수 간의 불균형이 크고, 단위가 일관되지 않으며, 누락된 값이 많은 경우(내부 검증 세트에서 48.5%) 등 여러 가지 단점이 있습니다.

이러한 데이터 문제를 해결하고 모델의 견고성을 보장하기 위해연구자들은 많은 데이터 정리 작업을 수행했습니다.포함하다:

* 모델을 구축할 때, 98개의 실험실 테스트 항목이 후보 입력 기능으로 나열되었습니다. 각 부서의 다양한 실험실 테스트 항목은 부서에서 동일하게 처리되었습니다.

* 누락된 데이터는 MICE(연쇄 방정식을 통한 다변량 대체) 알고리즘을 사용하여 대체되었습니다.

* 기관 간 데이터 분포 차이를 줄이기 위해 Box-Cox 알고리즘을 사용하여 데이터를 조정한 후 최소-최대 표준화를 통해 데이터를 정규화했습니다.

* 데이터 불균형 문제를 해결하기 위해 균형 비율이 0.5인 적응형 종합 표본 추출 방법을 사용합니다.

또한, MCF 프레임워크는 연구팀이 이전 연구에서 제안한 H-MCF(MCF 기반 계층적 예측 체계)의 변형입니다.연구진은 176개의 기본 분류 모델을 구축하고 특징 선택 방법을 기계 학습 분류기와 결합했습니다. 5중 교차 검증을 통해 176개 모델 중에서 상위 20개 기본 분류 모델을 선택했습니다.이 중에서, 특징 선택 프로세스는 분류기가 기본 분류 모델을 생성하는 데 사용할 수 있는 가장 중요한 20가지 특징을 식별합니다.

그런 다음 연구자들은 다중 기준 의사결정 이론을 기반으로 각 모델의 가중치를 추정하고 최종적으로 예측을 융합하여 일관된 분류에 도달했습니다.

상위 20개 기본 분류 모델

모델 성능은 기존 방식보다 훨씬 높습니다.

연구자들은 AUC, 정확도, 특이도, 민감도, 양성 예측도, 음성 예측도, F1 점수를 사용하여 MCF 모델의 예측 정확도를 정량화했습니다. 결과는 아래 그림과 같습니다.

연구진은 상위 20개 기본 분류 모델에서 52개 특징(51개 실험실 검사 지표 및 연령)을 선택했는데, 이 중 약 901개 TP3T 특징이 난소암 위험과 유의미하게 관련이 있는 것으로 나타났으며, SHAP(Shapley Additiveexplanation, 모델 예측을 평가하고 설명하는 기술)을 기반으로 유사한 일관된 특징 순위를 구축했습니다. 개별 특성의 예측 AUC는 0.477(AFP)에서 0.886(CA125)까지였으며 일반적으로 순위와 일치했습니다.

안에,51가지 실험실 검사 지표에는 정기적인 혈액 검사, 소변 검사, 생화학 검사 등이 포함됩니다.예를 들어, 혈소판 PLT, 피브리노겐 측정 FIB, 염증 정도를 평가하는 지표인 CRP, 혈청 알부민 수치를 측정하는 ALB, 적혈구 침강 속도 ESR, 소변 pH 값 등이 있습니다. 아래 그림 A는 검사 지표의 중요도 순위를 나타낸 것입니다.

기능 순위 및 상관 관계 분석

내부 검증 세트와 두 개의 독립적인 외부 검증 세트에 대한 MCF의 AUC는 각각 0.949(95%CI 0.948-0.950), 0.882(0.880-0.885), 0.884(0.882-0.887)였습니다.

연구진은 또한 난소암 검출에 있어서 MCF를 전통적인 종양 표지자와 비교했습니다.난소암을 구별하기 위한 세 가지 검증 세트 모두에서 MCF의 AUC, 민감도 및 F1 점수가 기존 종양 마커보다 높았습니다.다음 그림과 같이:

진행성 난소암과 대조군의 분류를 위해 내부 검증 세트에서 MCF의 AUC는 0.985였습니다. 첫 번째 외부 검증 세트에서는 0.972에 도달했고, 두 번째 외부 검증 세트에서는 0.943에 도달했습니다. 조기 난소암과 대조군을 분류하기 위한 MCF의 AUC는 내부 검증 세트에서 0.879, 첫 번째와 두 번째 외부 검증 세트에서 각각 0.823, 0.810이었습니다.

결과는 다음과 같습니다MCF 모델을 사용하여 난소암 환자, 특히 초기 단계의 난소암 환자를 식별하는 데 있어서 AUC와 민감도는 기존 난소암 마커인 CA125, HE4 및 이들의 조합보다 상당히 높았습니다.게다가 일부 지표가 누락된 인구에서도 난소암 위험을 정확하게 예측할 수 있는데, 이는 MCF 모델이 안정성이 좋고 실제 데이터와 호환성이 좋다는 것을 보여줍니다.

또한, 이 연구에서는 종양 표지자 외에도 DD 다이머 및 혈소판 수치와 같은 다른 일상적인 실험실 검사도 난소암의 진단 및 예측에 상당한 기여를 한다는 사실을 발견했으며, 이러한 검사 지표와 관련된 병태생리학적 과정이 난소암 발병에 중요한 역할을 할 수 있으며, 그 잠재적인 메커니즘을 더 탐구할 가치가 있음을 시사합니다.

AI는 1차 의료 개발을 강화합니다

"2022년 우리나라 의료산업 발전 통계 공보"에 따르면 우리나라에는 979,768개의 1차 의료보건기관이 있으며, 전국 의료보건기관 총수의 94,85%를 차지하지만, 진단 및 치료 건수로 보면 1차 의료보건기관의 진단 및 치료 건수는 42.7억 건으로, 연간 진단 및 치료 총수의 50.7%에 불과합니다. 우리나라의 1차 의료 및 보건 기관의 수는 높은 비중을 차지하지만, 진단 및 치료 건수는 여전히 개선의 여지가 많습니다.

또한, 국립암센터의 통계에 따르면, 우리나라의 암 의료 서비스 시장에서 공공 3차 병원이 수행한 암 치료 업무는 80%가 넘습니다. 이러한 A급 병원의 대부분은 지방 소재지에 위치해 있지만, 동시에 전국 각지에서 환자를 받아야 합니다. 의사들이 받는 압박은 상상할 수 있다.

그러나 최근 몇 년 동안 인공지능이 성숙하게 적용되면서 의료 산업은 무한한 상상력을 발휘할 수 있게 되었고, 1차 진료에 대한 새로운 아이디어를 제공하게 되었습니다. 본 연구에서 구축한 난소암 진단 모델 MCF는 오픈 소스로 공개되었습니다. 난소암의 위험값은 해당 실험실 검사 데이터와 연령을 입력하여 계산할 수 있으며, 이는 의심할 여지 없이 1차 의료기관에서 이 모델을 대중화하는 데 중요한 근거를 제공합니다.

1차 의료기관에 AI 지원 진단을 도입하는 것은 매우 중요합니다. 국무원이 이전에 발표한 "농촌 의료보건 체계의 건강한 발전을 촉진하기 위한 개혁을 더욱 심화하는 것에 대한 의견"에서도 농촌 의료보건 기관에 대한 AI 지원 진단의 배치 및 응용을 가속화해야 할 필요성이 언급되었습니다.

인공지능을 1차 의료기관에 적용하면 의료정보를 구조화된 데이터로 처리하고, '데이터 섬'과 데이터 품질의 문제를 해결하며, 지역 내 의료정보의 상호연결과 공유를 위한 기반을 마련할 수 있습니다. 또한 보조진료, 보조진단, 만성질환관리 등의 기능을 통해 1차진단 및 치료수준을 향상시키고, 진단오류 및 오진의 가능성을 낮추어 더 많은 곳에서 고품질의 진단과 치료를 받을 수 있도록 할 수 있습니다.

참고문헌:

1.https://www.sysu.edu.cn/news/info/2331/1091611.htm