12일 전

CellForge: 가제티브 설계를 통한 가상 세포 모델 개발

Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, Yan Cui, Daniel Shao, Weixu Wang, Fang Wu, Yuchen Zhuang, Wenqi Shi, Zhi Huang, Arman Cohan, Xihong Lin, Fabian Theis, Smita Krishnaswamy, Mark Gerstein
CellForge: 가제티브 설계를 통한 가상 세포 모델 개발
초록

가상 세포 모델링은 인공지능과 생물학의 교차 분야에서 등장한 새로운 전망으로, 다양한 외부 자극에 대한 반응과 같은 양적 특성을 예측하는 것을 목표로 한다. 그러나 생물학적 시스템의 복잡성, 데이터 모달리티의 이질성, 그리고 다학제적 영역에서의 도메인 전문 지식이 요구됨에 따라, 자율적으로 가상 세포를 위한 계산 모델을 구축하는 것은 여전히 큰 도전 과제이다. 본 연구에서는 생물학적 데이터셋과 연구 목표를 직접 입력받아 최적화된 가상 세포 계산 모델로 변환하는 다중 에이전트 프레임워크를 활용하는 'CellForge'라는 에이전트 기반 시스템을 제안한다. 구체적으로, 원시의 단세포 다오믹스 데이터와 작업 설명만을 입력으로 받아, 최적화된 모델 아키텍처와 가상 세포 모델의 학습 및 추론을 위한 실행 가능한 코드를 동시에 출력한다. 이 프레임워크는 세 가지 핵심 모듈로 구성된다: 데이터셋 특성 분석 및 관련 문헌 검색을 수행하는 '작업 분석(Task Analysis)', 전문 에이전트들이 협력하여 최적의 모델링 전략을 개발하는 '방법 설계(Method Design)', 그리고 코드 자동 생성을 수행하는 '실험 실행(Experiment Execution)'. 설계 모듈 내의 에이전트는 서로 다른 관점을 가진 전문가와 중재자 역할을 수행하는 중심 에이전트로 분리되며, 합리적인 합의에 도달할 때까지 공동으로 해결책을 교환한다. 우리는 CellForge가 단세포 외부 자극 반응 예측에 있어, 유전자 노크아웃, 약물 처리, 사이토카인 자극 등 다양한 조건과 다중 모달리티를 포함하는 여섯 가지 실제 데이터셋을 활용하여 성능을 검증하였다. 그 결과 CellForge는 각 작업에 특화된 최신 기술보다 일관되게 뛰어난 성능을 보였다. 종합적으로, 서로 다른 관점을 가진 대규모 언어 모델(LLM) 에이전트 간의 반복적 상호작용이 모델링 문제에 직접 접근하는 방식보다 더 우수한 해결책을 도출할 수 있음을 보여준다. 본 연구의 코드는 공개되어 있으며, 다음 링크에서 확인할 수 있다: https://github.com/gersteinlab/CellForge.

CellForge: 가제티브 설계를 통한 가상 세포 모델 개발 | 최신 연구 논문 | HyperAI초신경