362가지 흔한 질병을 진단하는 데 도움이 됩니다! Cambridge/Oxford/Warwick University 및 기타 대학은 의료 지식 그래프를 자동으로 구축하기 위해 다중 에이전트 대규모 언어 모델 프레임워크를 제안했습니다.

오늘날 의료 자원 부족은 세계 의료 시스템을 괴롭히는 장기적인 문제이며, 특히 1차 진료와 일반 의학 분야에서 '의사 부족'이 두드러집니다. 세계보건기구는 2030년이 되면 세계적으로 1,500만 명의 의료 종사자가 부족할 것으로 예측했습니다. 중국 국가통계국과 국가보건위원회의 자료에 따르면, 중국 전체의 의사 수는 해마다 증가하고 있지만, 일부 오지와 농촌 지역의 의사 수는 턱없이 부족합니다.
다단계 진단 및 치료는 "의사 부족"을 완화하는 효과적인 모델 중 하나입니다. 이 모델에 따르면 환자가 병원에 도착했을 때 문제가 무엇인지 판단할 수 없는 경우, 일반의는 먼저 예비 검사를 실시하여 문제의 전반적인 방향을 파악한 다음, 추가 진단 및 치료를 위해 심장내과, 신경과 등 관련 전문의에게 환자를 의뢰합니다. 이러한 다층적이고 협력적인 모델은 효율적이고 포괄적이며 전문적인 진단을 보장하고, 전문가의 업무 부담을 줄이며, 교육을 보다 집중적으로 실시하여 교육 주기를 단축하고 의사 자원을 신속하게 보충합니다.
하지만 의사의 시간과 에너지는 결국 제한되어 있습니다. 인공지능과 같은 첨단 기술을 활용해 진단 효율성을 높이고, 이를 통해 의사 인력 부족 문제를 완화하는 방법이 업계의 관심사가 되었습니다. 위에서 언급한 의료 계층적 협업 모델에서 영감을 받아,워릭대학교, 크랜필드대학교, 케임브리지대학교, 옥스퍼드대학교의 연구팀은 KG4Diagnosis를 제안했습니다.이는 일반의와 전문의가 협력하는 실제 의료 시스템을 2계층 아키텍처를 통해 시뮬레이션하는 새로운 계층적 다중 에이전트 프레임워크입니다. 이는 의료 지식 그래프의 구성, 진단, 치료 및 추론을 자동화하는 데 사용됩니다. 이 기술은 기존 의학 지식 그래프 구축 방법의 확장성과 비정형 데이터 처리 한계를 극복하여 비만 등 다양한 의학 분야에 걸쳐 362가지의 흔한 질병을 포괄합니다.
관련 결과는 "KG4Diagnosis: 의료 진단을 위한 지식 그래프 향상 기능을 갖춘 계층적 다중 에이전트 LLM 프레임워크"라는 제목으로 최고 학술대회 AAAI-25 브리지 프로그램에 게재되었습니다.

공식 계정을 팔로우하고 "Medical Knowledge Graph"에 답글을 남겨 전체 PDF를 받으세요.
MedQA 의료 텍스트 질의응답 데이터세트:
오픈소스 프로젝트인 "awesome-ai4s"는 100개가 넘는 AI4S 논문 해석을 모아 방대한 데이터 세트와 도구를 제공합니다.
https://github.com/hyperai/awesome-ai4s
KG4Diagnosis의 파괴적 의미는 무엇입니까?
연구자들은 왜 KG4Diagnosis를 개발했을까?
이는 실제로 인공지능을 사용하여 현실 세계의 계층적 의료 시스템을 시뮬레이션하여 의료 진단 추론의 복잡성을 해결할 수 있는지에 대한 아이디어에서 비롯되었습니다. 이렇게 하여 탄생한 것이 KG4Diagnosis 프레임워크입니다. 이 프레임워크는 일반의 대규모 언어 모델(GPLLM)과 여러 분야별 전문가 대규모 언어 모델(컨설턴트-LLM)을 통합하는 계층적 다중 에이전트 프레임워크입니다. 일반의(GP) 에이전트는 초기 평가와 분류를 수행한 다음 전문 에이전트와 협력하여 분야별 분석을 수행합니다.
프레임워크는 어떻게 구성되었나요?
간단히 말해서, 5단계로 나눌 수 있습니다.

(1) 입력된 의료 텍스트는 지식 그래프의 맥락적 제약에 부합하는 데이터 블록으로 분할되고 의미 기반 엔터티 추출 및 관계 추출 모듈에 의해 처리됩니다.
(2) 추출된 엔터티와 관계는 전용 데이터베이스에 저장됩니다.
(3) 이러한 데이터베이스는 의료 지식 그래프를 구축하는 데 사용됩니다.
(4) 진단 추론을 강화하기 위해 의료 지식 그래프를 대규모 언어 모델(LLM) 및 다중 에이전트 시스템과 결합합니다.
(5) 진단 결과는 인간의 추론을 통해 사용자 엔드포인트로 피드백됩니다.
분명히 이 접근 방식은 광범위한 언어 모델의 역량과 전문화된 의학 지식의 정확성을 결합하여 더욱 진보된 진단 결과를 달성합니다. 연구팀에 따르면, 이 시스템의 훈련 방법은 다양한 의학 전문 분야에 걸쳐 흔한 질병 362개를 포괄하며, 이는 광범위한 의학적 진단을 나타냅니다.
이 시스템을 실제로 적용하면 어떤 효과가 있나요?
다음 다이어그램은 이 연구에서 제안한 새로운 프레임워크가 진단 프로세스에 어떻게 협력하는지, 그리고 AI 시스템이 개인화된 의료 조언을 제공하는 데 어떻게 도움을 줄 수 있는지 보여줍니다. 환자가 증상을 설명하고, 의사가 명확한 질문을 하고, AI가 설명과 제안을 제공합니다.

* 환자: "선생님, 요즘 귀에서 울림이 계속 느껴져요. 특히 밤에요. 끊임없이 윙윙거리는 소리가 나는 것 같아서 수면과 집중에 방해가 돼요."
* 의사: "이명이 계속되나요, 아니면 가끔씩 나타나나요? 두통, 청력 손실, 귀 통증 등 다른 증상도 있나요?"
* AI: "불편하시다니 안타깝습니다. 이명은 큰 소음 노출, 귀 감염, 고혈압, 스트레스 등 다양한 요인으로 인해 발생할 수 있습니다. 최근에 청력 검사나 귀 검사를 받으셨나요? 이러한 검사는 이명의 심각도와 원인을 파악하는 데 도움이 될 수 있습니다."
아래 그림은 비만 분야의 지식 그래프에서 시스템의 전문성을 더욱 잘 보여줍니다. 비만, 2형 당뇨병 및 심혈관 질환 간의 관계, 이들의 일반적인 증상, 치료 및 합병증을 보여주고 복잡한 건강 문제를 해결하는 데 있어 약물의 다면적인 역할을 강조합니다.

요약하자면, 이 연구는 다중 에이전트 검증과 지식 그래프 제약을 통해 의료 진단에서 대규모 언어 모델(LLM)이 겪는 환각 문제를 해결하고, 포괄적인 벤치마크 테스트를 통해 이러한 메커니즘의 효과를 검증합니다. 동시에 연구진은 실제 의료 시나리오를 통해 이 프레임워크의 실용적 가치를 입증했으며, 이 프레임워크의 미래 적용 가능성도 기대할 만합니다.
기술과 응용이 모두 발전하고 있습니다! 인공지능 기반 진단의 미래는 밝다
의학 지식 그래프 연구 진행 상황
위 연구팀이 제안한 KG4Diagnosis는 지식 그래프 강화를 기반으로 한 계층적 다중 에이전트 대규모 언어 모델 프레임워크입니다. 소위 지식 그래프(KG)는 물리적 세계의 개념과 그 관계를 상징적 형태로 설명합니다.
현재, 의료 지식 그래프를 구성하는 방법에는 전통적인 규칙 기반 시스템과 고급 인공 지능 모델이 있습니다. 규칙 기반 접근 방식은 신뢰성은 제공하지만 확장성이 부족하고, GPT 및 MedPaLM과 같은 언어 모델은 구조화되지 않은 데이터에서 구조화된 지식을 생성하는 잠재력을 보여주지만 환각성과 정확성 문제에 직면합니다.
이러한 과제에 직면하여 많은 연구팀은 다양한 방향을 모색했습니다. 예를 들어, 대규모 언어 모델에서 환각 문제를 해결하기 위해 지식 그래프에서 관련 사실을 검색하는 것이 유망한 접근 방식으로 여겨졌습니다. 기존의 KG 증강 방법은 각 사실에 대해 여러 차례의 검색 및 검증을 필요로 하기 때문에 실제 상황에 적용하기 어렵습니다. 임페리얼 칼리지 런던의 연구팀은 의학 분야에서 LLM의 응답 사실성을 높이고 검색 노력을 줄이기 위해 자기개선 강화 지식 그래프 검색(Re-KGR) 방법을 제안했습니다. 관련 결과는 "자체 개선을 통한 대규모 언어 모델의 환각 완화"라는 제목으로 arXiv에 게재되었습니다.
동시에 업계에서는 의료 지식 그래프를 사용하여 대규모 의료 모델을 구축하는 데 있어서도 획기적인 성과를 달성했습니다. 예를 들어, 기본 모델(FM)은 방대한 양의 레이블이 지정되지 않은 데이터에서 학습하여 광범위한 작업에서 뛰어난 성능을 입증할 수 있습니다. 그러나 생물의학 분야를 위해 개발된 FM은 여전히 대부분 단일 모드입니다. 이러한 한계를 극복하기 위해 UIUC 연구팀은 BioBRIDGE를 제안했습니다. 이는 기본 단봉 FM을 미세 조정하지 않고도 지식 그래프를 사용하여 하나의 단봉 FM과 다른 단봉 FM 간의 변환을 학습합니다.
결과에 따르면 BioBRIDGE는 교차 모달 검색 작업에서 가장 우수한 기준선 KG 임베딩 방법(평균 약 76.3% 더 높음)을 능가할 수 있는 것으로 나타났습니다. 관련 연구 결과는 "BIOBRIDGE: BRIDGING BIOMEDIICAL FOUNDATION MODELLS VIA KNOWLEDGE GRAPHS"라는 제목으로 발표되었으며, ICLR 2024에 게재되었습니다.
인공지능 기반 진단으로 효율성 향상 및 의료진 인력 부족 해소
기술의 발전은 궁극적으로 실제 응용 분야에 적용되고, 의사의 업무 부담을 줄이며, 진단의 정확성과 효율성을 개선하는 데 목적이 있습니다. AI는 방대한 양의 의학적 지식과 임상 데이터를 통합하여 최근 몇 년 동안 보조 진단 분야에서 많은 주요 진전을 이루었습니다.
2024년 11월, AI 지원 진단이 국가보건의료보장청 사업 지침에 처음으로 포함되었습니다. 국가보건안전청은 비교적 성숙한 인공지능 지원 기술이 임상에 적용되어 환자에게 추가적인 부담을 주지 않도록 지원하기 위해 인공지능의 잠재적 적용 시나리오를 분석하고 영상의학 검사, 초음파 검사, 재활 사업 등에 '인공지능 지원' 확대 항목을 설정했습니다. 어떤 의미에서 이는 미래에 AI 지원 진단을 대규모로 적용하기 위한 정책적 기반을 마련하는 셈입니다.
구체적인 응용 분야를 살펴보면, 2024년 2월, 남중국이공대학 연구팀은 데이터 세트를 기반으로 훈련된 AI 모델과 안저 카메라와 같은 일련의 하드웨어 장치를 통합한 지능형 안구 질환 검진 시스템을 개발했다고 발표했습니다. 안저 컬러 사진 촬영을 완료한 후 15초 이내에 30가지 이상의 질병에 대한 진단 권장 사항을 제공할 수 있습니다.
2024년 6월, OpenAI는 공식 블로그에서 Color Health가 OpenAI의 GPT-4o 모델을 사용하여 의사가 암 환자를 선별하고 치료하는 데 도움이 되는 AI 보조 조종사를 개발하여 치료 효율성을 높였다고 밝혔습니다. 공식 자료에 따르면, AI 보조원을 활용하는 의료기관은 AI 보조원을 활용하지 않는 의료기관보다 4배 더 많은 병리학적 결과를 식별할 수 있습니다. 또한 AI 보조 기능을 도입한 경우 임상의가 환자 기록을 분석하는 데 걸리는 시간은 평균 5분이었지만, AI 보조 기능이 없었다면 데이터가 분산되어 몇 주 동안 지연이 발생할 가능성이 있었습니다.
또한, iFlytek Medical은 AI 지원 진단을 통해 160만 건의 주요 오진을 교정하고 6,000만 건의 비이성적이거나 의심되는 잘못된 약물을 감지하여 1차 진단 및 치료 역량을 개선하고 오진 및 진단 누락을 방지했다고 보고되었습니다.
저는 기술을 바탕으로 미래에는 AI가 의사의 '오른팔'이 되어 의료 서비스의 접근성과 질을 지속적으로 향상시킬 것이라고 믿습니다.
참고문헌:
1.https://arxiv.org/abs/2412.16833
2.https://zh.wikipedia.org/wiki/%E7%9F%A5%E8%AD%98%E5%9C%96%E8%AD%9C
3.https://53ai.com/news/LargeLanguageModel/2024060240513.html
4.https://hub.baai.ac.cn/view/36889
5.https://www.yicai.com/news/102371268.html
6.https://m.yicai.com/news/102153745.html