HyperAIHyperAI

Command Palette

Search for a command to run...

생물학적 다중 에이전트 로빈은 단 30분 만에 550편의 연구 논문을 성공적으로 통합하여 자율적인 연구 루프를 구축하고 dAMD 치료 후보 물질을 식별했습니다.

Featured Image

생물학적 검출, 교란 실험 및 전산 모델링 기술의 지속적인 발전으로 생명 과학 연구의 정밀도와 규모가 빠르게 향상되고 있습니다. 그러나 급속도로 증가하는 데이터 생산 능력에 비해 연구 시스템의 지식 통합 및 과학적 추론 능력은 현저히 뒤처져 있습니다.방대한 양의 귀중한 정보가 논문, 데이터베이스, 실험 결과 등 다양한 분야에 흩어져 있습니다. 수동으로 정보를 분류하는 것은 비효율적일 뿐만 아니라, 서로 다른 분야의 기존 연구 결과를 종합하기 어렵게 만듭니다.이로 인해 검증된 많은 연구 결과들이 적시에 새로운 연구 아이디어나 임상 프로토콜로 이어지지 못하는 경우가 발생했습니다.

이러한 "지식 파편화" 문제는 특히 "약물 용도 변경" 분야에서 두드러지게 나타납니다. 다브라페닙의 이보호 효과에 대한 후속적인 발견이나 케타민의 새로운 치료적 가치 확장 모두 임상 적용까지 수년 또는 수십 년의 지연을 겪었는데, 이는 과학 연구 과정에서 지식 발견 및 통합에 있어 현재 존재하는 병목 현상을 반영합니다.

최근 몇 년 동안 대규모 언어 모델(LLM)은 방대한 코퍼스 학습을 통해 검색, 귀납적 추론, 논리적 추론 능력을 개발하여 생명 과학 연구에서 잠재력을 보여주기 시작했습니다. 이러한 모델은 미세 조정, 검색 강화 생성(RAG), 다중 에이전트 협업 기술을 결합하여 문헌 분석, 약물 예측, 과학적 가설 생성과 같은 개별 작업에서 인간의 성능에 도달하거나 심지어 능가했습니다. 그러나기존의 AI 도구들은 대부분 연구 과정의 특정 부분만을 다룰 뿐, "가설 생성-실험 설계-데이터 분석-결과 도출"이라는 전체 과정을 진정으로 연결하지 못합니다.따라서 진정한 의미의 폐쇄 루프 지능형 과학 연구는 아직 달성될 수 없다.

이 문제를 해결하기 위해 샌프란시스코의 퓨처하우스, 옥스퍼드 대학교, 포드햄 대학교의 공동 연구팀은 로빈 생물학적 다중 에이전트 시스템을 제안했습니다.이는 과학적 가설 생성 능력과 실험 데이터 분석 능력을 동시에 통합하여 연속적인 폐쇄 루프 워크플로우를 구현하는 최초의 생의학 지능형 시스템입니다.

로빈은 문헌 검색 에이전트와 데이터 분석 에이전트의 협업을 통해 질병 메커니즘 분석, 후보 약물 스크리닝, 실험 검토 및 가설 검증을 반자동으로 수행할 수 있습니다. 연구팀은 치료 옵션이 제한적이고 임상적 요구가 시급한 건성 연령 관련 황반변성(dAMD)을 응용 시나리오로 사용하여 로빈의 지능형 약물 스크리닝 기능을 검증했으며, 이를 통해 AI 기반 신약 개발 및 약물 재활용을 위한 새로운 실용적 패러다임을 제시했습니다.

"과학적 발견 자동화를 위한 다중 에이전트 시스템"이라는 제목의 관련 연구 결과가 네이처(Nature)에 게재되었습니다.

연구 하이라이트:

* 로빈 시스템은 문헌 가설 생성과 생물학적 실험 데이터 분석을 연속적인 폐쇄 루프 워크플로우로 통합한 최초의 시스템입니다.

* 로빈은 다양한 분야의 과학 연구 결과를 적용할 수 있습니다. 치료제 개발 분야에서는 목표 질환의 이름만 입력하면 시스템이 자동으로 해당 질환의 주요 병리학적 메커니즘을 선별하고, 체외 실험 모델을 매칭하고, 후보 약물을 제안하고, 실험 데이터 분석을 완료하고, 후보 분자를 반복적으로 업데이트합니다.

로빈은 건성 황반변성을 연구 사례로 사용하여 ROCK 억제제를 통해 망막색소상피세포의 식세포 기능을 향상시키는 새로운 치료 전략을 최초로 제안했습니다.

논문 보기:
https://www.nature.com/articles/s41586-026-10652-y

데이터 세트: 공개 문헌, 생물정보학 벤치마크 및 실험 데이터를 포함합니다.

본 연구에서는 공개적으로 이용 가능한 문헌 데이터, 일반적인 생물정보학 벤치마크 데이터, 그리고 자체 실험 데이터로 구성된 3단계 데이터 시스템을 구축했습니다.이 프로그램은 문헌 텍스트 분석, 생물정보학 분석 작업, 세포 탐지 및 전사체 시퀀싱을 포함한 다양한 유형의 작업을 다룹니다.이 문서는 기본적으로 AI 기반 신약 개발 과정에서 핵심적인 데이터 시나리오를 다룹니다.

먼저 연구진은 dAMD와 관련된 중국어 및 영어 과학 연구 논문 551편을 통합하여 시스템이 과학적 가설을 생성하는 데 필요한 지식 기반으로 활용했습니다.여기에는 질병 메커니즘에 관한 연구 151건과 망막 색소 상피 세포의 식세포 기능 및 질병과의 연관성에 관한 연구 논문 400편이 포함됩니다.이 문헌은 질병 메커니즘을 규명하는 데 도움이 될 뿐만 아니라 시험관 내 실험 모델을 선별하고 약물 재활용을 위한 후보 약물을 발굴하는 데 이론적 기반을 제공합니다. 이는 로빈의 지식 발굴 노력에 있어 핵심적인 자료입니다.

둘째로, 연구진은 일반적인 생물정보학 벤치마크 데이터셋인 BixBench를 사용하여 시스템의 데이터 분석 기능을 정량적으로 평가했습니다.본 연구에서는 신약 개발과 관련된 시험 문제 170개를 선정했습니다.이 테스트는 전사체 분석, 유전체학, 기능 풍부도 분석, 서열 분석 및 통계 검정을 포함한 다양한 유형의 작업을 다룹니다. 모든 문제에는 표준화된 데이터 패키지, 정답 및 오답 보기가 함께 제공되어 실제 생물정보학 시나리오에서 에이전트의 적응성과 안정성을 체계적으로 평가할 수 있습니다.

또한,연구진은 모델 반복 및 실험적 검증을 위한 실제적인 지원을 제공하기 위해 자체 실험 데이터 세트를 구축했습니다.본 데이터에는 ARPE-19 세포 및 인간 일차 망막색소상피줄기세포의 유세포 분석 결과, 다양한 약물 처리 후 RNA 시퀀싱 전사체 데이터, 세포독성, 면역세포화학 염색 및 VEGF 효소면역측정법 결과가 포함됩니다. 인간 세포 샘플은 뉴욕 비전 리페어 안은행에서 제공받았으며, 모두 안질환이 없는 60세 이상 기증자의 망막색소상피줄기세포이므로 실험 데이터의 신뢰성과 임상적 참고 가치를 보장합니다.

로빈: 생의학 과학 발견을 위한 다중 에이전트 시스템

Aviary 프레임워크를 기반으로 Jupyter Notebook 환경에서 실행되는 Robin은 단일 작업만 수행하는 기존 연구용 AI 도구와는 다릅니다. Robin은 "과학적 가설 생성—실험 분석—결과 피드백—가설 반복"이라는 연속적인 폐쇄 루프 워크플로를 구현한 최초의 도구입니다.이 시스템은 질병 메커니즘 연구, 후보 약물 선별, 실험 데이터 분석을 포함한 전체 과학 연구 과정을 반자동으로 완료할 수 있습니다.

Robin 시스템 아키텍처 및 워크플로우

이 시스템은 두 개의 문서 에이전트와 하나의 데이터 분석 에이전트가 함께 작동하는 "3개 에이전트" 핵심 아키텍처를 채택합니다.

안에,문서 정보 분석 에이전트인 크로우와 팔콘은 주로 문서에서 지식을 추출하고 과학적 가설을 생성하는 역할을 담당합니다.두 도구 모두 OpenAI o4-mini 모델을 기반으로 합니다. Crow는 질병 관련 문헌 검색, 병리학적 기전 분석, 실험 모델 스크리닝 및 초기 약물 후보 물질 발굴을 담당합니다. 이를 통해 단편적인 연구들을 체계적으로 통합하고 핵심적인 과학적 결론을 도출할 수 있습니다. Falcon은 심층적인 검증 및 최적화를 담당합니다. Crow가 제시한 후보 물질의 약리학적 기전, 이론적 근거 및 잠재적 한계를 추가적으로 분석하고, 문헌상의 잘못된 인용을 수정하여 대규모 모델의 "착각" 문제를 줄입니다.

세 번째 핵심 모듈인 Finch는 생물학적 실험 데이터를 분석하기 위해 특별히 설계된 지능형 에이전트입니다.고정된 분석 스크립트에 의존하는 기존 도구와 달리, Finch는 생성적 추론 방식을 사용하여 실험 데이터의 특성에 따라 실시간으로 Python 또는 R 코드를 생성하고 실행합니다. 이를 통해 유세포 분석, RNA-seq 차등 발현 분석, 유전자 기능 풍부도 분석과 같은 작업을 적응적으로 수행할 수 있습니다. 즉, 이 시스템은 더 이상 미리 정의된 분석 워크플로에 제한되지 않고 연구자처럼 분석 전략을 동적으로 조정할 수 있습니다.

데이터 분석에서 대규모 모델의 무작위성을 줄이기 위해,로빈은 또한 "다중 궤적 분석 + 합의 통합" 메커니즘을 설계했습니다.이 시스템은 8개의 독립적인 Finch 분석 궤적을 동시에 실행할 수 있습니다. 각 궤적은 독립적으로 코드 생성, 데이터 분석 및 결과 출력을 완료합니다. 마지막으로, 여러 궤적의 결론을 메타 분석을 통해 통합함으로써 단일 라운드 분석에서 발생하는 변동 및 매개변수 차이로 인한 편차를 줄이고 결과의 안정성을 향상시킵니다.

평가 메커니즘 측면에서 로빈은 2단계로 구성된 대규모 모델 검토 시스템을 도입했습니다.이 시스템은 Anthropic의 Claude 3.7 Sonnet을 핵심 검토 모델로 사용하고, Google Gemini 2.5 Pro와 결합하여 해당 분야 전문가의 선호도에 맞춰 조정합니다.후보 작용 기전, 실험 모델 및 약물 요법은 쌍대 비교 및 토너먼트 랭킹을 통해 계층적으로 평가됩니다. 평가 대상 요법의 수가 적을 때는 전체 쌍대 비교를 사용하고, 수가 많을 때는 무작위 샘플링을 사용하여 비교합니다. 브래들리-테리-루스(Bradley-Terry-Luce) 모델을 사용하여 가중 랭킹을 계산함으로써 평가 정확도를 확보하고 계산 비용을 관리합니다.

또한 분석 과정의 재현성을 보장하기 위해 모든 Finch 작업은 독립적인 Docker 컨테이너 환경에서 실행되며, 완전한 생물정보학 툴체인이 사전 설치되어 있습니다. 연구팀은 Prompt 엔지니어링을 여러 차례 거쳐 워크플로우를 최적화하고 간소화하여, 복잡했던 기존 프로세스를 안정적이고 사용하기 쉬운 Jupyter 워크플로우로 압축함으로써 연구 환경에서의 시스템 활용성을 더욱 향상시켰습니다.

로빈은 리파수딜이 식세포 능력을 1.89배 증가시킨다는 사실을 발견했습니다.

본 연구는 dAMD를 핵심 응용 시나리오로 삼아 Robin의 가설 생성 능력, 데이터 분석 능력, 아키텍처 효율성 및 실제 신약 개발 효율성을 중심으로 다양한 검증 실험을 설계합니다.

핵심 실험은 후보 약물 선별 및 작용 메커니즘 검증에 중점을 둡니다. 로빈은 문헌 분석을 통해 황반변성(dAMD)의 주요 병원성 기전 10가지를 처음으로 규명하고, "망막 색소 상피 세포의 식세포 기능 강화"를 핵심 치료 방향으로 설정했습니다.1차 선별 과정에서 시스템은 30개의 후보 약물을 제안했습니다. 연구진은 이 중에서 엑세나티드, 핑골리모드, Y-27632 등을 선택하여 실험을 진행했으며, 효과가 입증된 MFGE8을 양성 대조군으로 사용했습니다.

식세포작용 실험 과정 도표

이후 로빈은 독자적으로 전사체 시퀀싱 실험 프로토콜을 제안했고, 핀치는 데이터 분석을 완료했다. 분석 결과, Y-27632는 액틴 세포골격, 자가포식 경로 및 핵심 지질 수송 유전자 ABCA1을 조절함으로써 망막색소상피세포의 전사체 재프로그래밍을 유도할 수 있음이 밝혀졌으며, 이는 기존에 알려지지 않았던 작용 메커니즘이다.

약물 스크리닝의 임상적 관련성을 더욱 높이기 위해, 본 연구에서는 후속적으로 2차 약물 반복 실험을 진행했습니다. 로빈은 10개의 새로운 약물 후보 물질을 추가했고, 시판 중인 녹내장 치료제 리바수딜이 Y-27632보다 효과적이며 세포 식균 작용 능력을 약 1.89배 증가시킨다는 사실을 발견했습니다.연구팀은 실제 생리적 환경에 더 가까운 인간 망막색소상피 줄기세포를 사용하여 재검사를 진행했습니다. 그 결과, 리바수딜과 Y-27632의 용량 의존적 효과가 다시 한번 확인되었으며, 리바수딜은 뚜렷한 세포독성이 없어 임상 적용 가능성이 높다는 것을 보여주었습니다.

Y-27632로 처리한 망막색소상피세포의 전사체 시퀀싱 분석

특히, 로빈은 생체리듬 조절제인 KL001이 식세포 기능을 향상시킬 가능성이 있다는 것을 발견하여 황반변성 치료를 위한 새로운 연구 방향을 제시했습니다. 이후 전사체 검증을 통해 리파수딜이 ABCA1 발현을 안정적으로 상향 조절할 수 있음이 확인되었으며, 이로써 리파수딜의 핵심 작용 경로가 규명되었습니다.

리파수딘과 KL001은 망막색소상피세포의 식세포 기능을 향상시킨다

경쟁 범용 AI 연구 시스템과의 비교에서, 연구팀은 OpenAI Deep Research Agent를 호출하는 데 동일한 명령어를 사용했습니다. 생성된 17개의 후보 약물 중 어느 것도 식세포 작용 증진 활성을 보이지 않았으며, ROCK 억제의 핵심 메커니즘도 밝혀내지 못했습니다. 이는 특정 생의학 시나리오에서 Robin의 적응력이 뛰어나다는 점을 더욱 강조합니다.

또한 BixBench 벤치마크 테스트에서,Finch 에이전트의 전체 정확도는 22.8±1.7%에 도달했으며, 이는 순수 대규모 언어 모델의 1.6±1.2%보다 상당히 높은 수치입니다.생물통계학 작업의 정확도는 47.9 ± 1.51 TP3T에 도달했고, 기본 유세포 분석은 1001 TP3T, RNA-seq 분석은 861 TP3T에 도달했습니다. 이러한 결과는 특별히 설계된 연구 에이전트 프레임워크가 생물 데이터 분석에서 범용 대규모 모델의 실용적인 기능을 크게 향상시킬 수 있음을 보여줍니다. 그러나 복잡하고 다단계적인 생물정보학 작업에서는 추가적인 최적화의 여지가 여전히 남아 있습니다.

로빈은 효율성과 비용 측면에서도 분명한 이점을 보여줍니다. 연구 통계에 따르면 이 시스템을 사용한 단일 연구 워크플로우의 평균 비용은 약 10.76달러에 불과합니다. 반면,로빈은 551개의 문서에 대한 통합 분석을 30분 만에 완료할 수 있었습니다.일반적으로 동일한 양의 작업을 수작업으로 처리하려면 800시간 이상이 소요됩니다. 하지만 이 시스템은 연구 과정의 한 단계를 2시간 이내에 완료하며, 이는 기존의 수동 연구 방식보다 약 200배 더 효율적입니다.

마지막 말

로빈의 중요성은 단순히 여러 잠재적 신약 후보 물질을 발견했다는 점을 넘어섭니다. 더욱 중요한 것은, 생명과학 분야에서 인공지능이 단순한 "보조 도구"에서 "반자율 연구 시스템"으로 진화할 가능성을 처음으로 입증했다는 점입니다. 물론 이러한 시스템이 완전히 "자율적인 과학자"가 되는 것은 아직 요원합니다. 복잡한 실험 설계, 다양한 규모의 생물학적 메커니즘 이해, 결과 해석 가능성 등은 여전히 해당 분야 전문가의 참여에 크게 의존합니다. 하지만 로빈의 등장은 인공지능이 더 이상 연구자들의 "효율성 향상"을 돕는 도구에 그치지 않고, 점차 과학적 발견 자체에 참여할 수 있는 능력을 갖춰가고 있음을 보여줍니다.