HyperAIHyperAI

Command Palette

Search for a command to run...

의사결정을 위한 오픈소스 모델 간 메디에이터 지도형 다중 에이전트 협업

Kaitao Chen Mianxin Liu Daoming Zong Chaoyue Ding Shaohao Rui et al

초록

복잡한 의료 결정 과정은 다양한 임상의들이 협력하는 워크플로우를 포함한다. 인공지능 다중 에이전트 시스템을 설계함으로써 인간 수준의 임상 결정 과정을 보다 빠르고 강화할 수 있다. 기존의 다중 에이전트 연구는 주로 언어 기반 작업에 집중해 왔으나, 다중모달 환경으로의 확장은 여전히 도전 과제이다. 다양한 시각-언어 모델(VLM)을 단순히 결합하는 것은 오류가 발생할 가능성이 높은 해석 결과를 악화시킬 수 있다. 크기가 유사한 대규모 언어 모델(LLM)에 비해 일반적인 VLM은 지시사항 수행 능력과 특히 자기반성 능력이 낮아 제한이 있다. 이러한 격차는 VLM이 협업 워크플로우에서의 활용 능력을 크게 제약한다. 본 연구에서는 의료 다중모달 결정 과정을 위한 매개자 유도형 다중 에이전트 협업 프레임워크인 MedOrch를 제안한다. MedOrch는 LLM 기반의 매개자 에이전트를 활용하여, 다수의 VLM 기반 전문 에이전트들이 출력 내용을 교환하고 반성함으로써 협업을 가능하게 한다. 고가의 GPT 시리즈 모델 대신, 개방형 일반 목적 및 영역 특화 VLM을 다수 활용함으로써 이질적 모델들의 강점을 입증한다. 본 연구는 서로 다른 VLM 기반 에이전트 간의 협업이 개별 에이전트의 성능을 초월할 수 있음을 보여준다. 제안한 방법은 다섯 가지 의료 시각 질의 응답 벤치마크에서 검증되었으며, 모델 학습 없이도 우수한 협업 성능을 나타낸다. 본 연구 결과는 매개자 유도형 다중 에이전트 협업이 의료 다중모달 지능의 발전에 있어 중요한 가치를 지닌다는 점을 강조한다. 본 연구의 코드는 공개될 예정이다.


AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
의사결정을 위한 오픈소스 모델 간 메디에이터 지도형 다중 에이전트 협업 | 문서 | HyperAI초신경