AI 모델, 간암 치료 효과 예측에 의사와 동등한 정확도 보여
중국 과학원 합비 물리과학연구소의 리 하이 교수를 중심으로 한 연구팀이 대형 언어 모델(LLM)을 이용해 간암 치료 반응을 예측하는 방법에 대해 체계적으로 연구한 최초의 팀으로 알려졌다. 이 연구는 AI 기반 정밀 의학의 새로운 길을 제시하며, 그 결과는 Journal of Medical Systems에 발표되었다. 간세포암(HCC)은 전 세계적으로 가장 흔하고 사망률이 높은 암 중 하나다. 고급 HCC 환자들에게 면역 체크포인트 억제제와 표적 치료제를 결합한 치료법은 일부 희망을 제공하지만, 효과적인 반응을 보이는 환자는 약 30%에 불과하다. 따라서 치료 반응을 정확히 예측하는 것은 개인화된 종양학에서 충족되지 않은 중요한 필요사항이다. 이번 연구에서는 GPT-4, GPT-4o, Google Gemini, 그리고 DeepSeek 등 주요 LLM들의 성능을 평가했다. 이 모델들은 간암 데이터로 사전 학습을 받지 않은 상태에서 제로샷 학습(zero-shot learning)을 통해 치료 결과를 예측하도록 테스트되었다. 연구에 사용된 데이터셋은 186명의 수술이 불가능한 HCC 환자들의 임상 및 영상 정보를 포함하고 있다. 성능 향상을 위해 연구팀은 투표 규칙과 논리적 조합 등의 다양한 의사결정 전략을 시험했으며, 이를 바탕으로 Gemini-GPT라는 하이브리드 모델을 개발했다. Gemini-GPT 모델은 15년 이상 경력을 가진 고참 의사들과 같은 예측 정확도를 보였으며, 주니어와 중급 의사들보다 속도와 정확도에서 우수한 성능을 발휘했다. 다양한 치료 유형과 병기 단계에서 일관된 결과를 제공하면서, 특히 치료에 반응할 가능성이 높은 환자를 식별하는 데서 human 의사들보다 더욱 안정적인 모습을 보였다. 단순한 논리 전략을 적용함으로써 Gemini-GPT 모델의 임상 환경에서의 실용성이 더욱 향상되었다. 리 하이 교수는 "이 연구는 AI가 의사들이 더 나은 결정을 내리고, 암 환자에게 더욱 개인화된 치료를 제공하는 데 어떻게 도움이 될 수 있는지를 보여줍니다"라고 말했다. 이 연구는 신뢰할 수 있는 AI를 실제 종양학에 통합하는 중요한 단계를 밟았음을 입증한다. LLM이 단순히 언어 처리뿐 아니라 추론, 예측, 그리고 중요한 의료 결정을 지원할 수 있다는 것을 보여주었다. 해당 연구는 Journal of Medical Systems에 게재되었으며, Xun Jun 등이 저술한 "수술이 불가능한 간세포암에서 면역 요법 반응 예측: 대형 언어 모델과 인간 전문가의 비교 연구"에서 자세히 다루어졌다. DOI: 10.1007/s10916-025-02192-1 이 연구는 AI 기술이 종양학 분야에서 어떻게 사용될 수 있는지를 보여주는 중요한 사례로, 앞으로의 의료 AI 발전에 있어 큰 영향을 미칠 것으로 전망된다. 연구팀의 노력은 AI의 임상 적용 가능성과 신뢰성을 높이는 데 크게 기여할 것으로 기대된다.