온라인 튜토리얼 | 150개의 전문 도구/59개의 데이터베이스/105개의 패키지, Biomni는 8개의 실제 연구 과제에서 전문가 수준의 효율성을 능가합니다.

현대 생물의학 연구는 "데이터 폭발과 효율성 병목 현상"이라는 모순에 봉착해 있습니다. 한편으로는 유전자 시퀀싱 및 단일 세포 분석과 같은 기술의 발전으로 유전체 염기 서열부터 임상 영상 데이터, 미생물군집의 종 풍부도부터 대사체의 소분자 지도까지 방대한 멀티모달 데이터가 생성되었으며, 데이터 규모는 PB(10억 달러) 수준에 도달했습니다. 다른 한편으로는 연구 프로세스의 단편화로 인해 연구 결과가 도출되는 속도가 심각하게 제한되었습니다. 일반적인 멀티오믹스 분석에는 10개 이상의 도구를 호출하고, 수십 개의 데이터베이스를 쿼리하고, 수백 편의 논문을 참조해야 할 수 있으며, 이러한 작업은 종종 연구자가 직접 수행해야 하므로 시간이 많이 소요될 뿐만 아니라 오류 발생 가능성도 높습니다.
그러나 대부분의 기존 AI 도구는 CRISPR 실험 설계나 단일 세포 주석에 초점을 맞춘 모델과 같이 "특수화"된 것입니다.그들은 단일 작업만 처리할 수 있으며 여러 도메인에서 협업하는 데 어려움을 겪습니다.연구가 유전학과 약리학의 교차점을 포함하거나 임상 데이터와 기초 연구 결과를 통합해야 하는 경우, 이러한 도구들은 그 역할을 제대로 수행하기 어렵습니다. 따라서 경계를 넘나들며 생각하고 인간 과학자처럼 자율적인 결정을 내릴 수 있는 범용 생의학 지능형 에이전트를 개발하는 것이 현재의 연구 딜레마를 해결하는 열쇠가 되었습니다.
이와 관련하여,스탠포드 대학은 제넨텍, 아크 연구소, UCSF 및 기타 기관과 협력하여 최초의 범용 생물의학 AI 에이전트인 Biomni를 개발했습니다.다양한 생의학 하위 분야에 걸쳐 광범위한 연구 과제를 자율적으로 수행하고, 25개 생의학 분야의 수만 건에 달하는 논문에서 필요한 도구, 데이터베이스 및 솔루션을 추출하여 최초의 통합 환경 에이전트를 구축할 수 있습니다. 이를 기반으로 Biomni는 대규모 언어 모델(LLM) 추론, 검색 강화 계획 및 코드 기반 실행을 결합한 일반 에이전트 아키텍처를 갖추고 있어, 사전 정의된 템플릿이나 엄격한 작업 프로세스에 의존하지 않고도 복잡한 생의학 워크플로를 동적으로 구축하고 실행할 수 있습니다. 시스템 벤치마크 결과는 Biomni가 특정 작업에 대한 프롬프트 튜닝 없이도 이기종 생의학 작업에서 강력한 일반화를 달성함을 보여줍니다.
서류 주소:
원클릭 배포 튜토리얼 링크:
Biomni의 핵심 목표는 미리 정의된 템플릿이 필요 없는 일반적인 생물의학 AI 에이전트를 개발하여 여러 도메인의 연구 작업을 자율적으로 완료할 수 있도록 하는 것입니다.구체적으로 여기에는 역량의 세 가지 측면이 포함됩니다.
* 작업별 제한 사항 돌파:Biomni는 자연어 명령만을 사용하여 "희귀 질환 진단"에서 "미생물군 차이 분석"까지 다양한 작업을 처리할 수 있기를 기대합니다.
* 다중 모드 기능 통합:데이터에서 실험까지의 전체 과정을 개방하세요. 생물의학 연구의 닫힌 고리는 "데이터 입력 → 분석 및 추론 → 가설 생성 → 실험 설계 → 결과 검증"입니다. Biomni는 모든 연결 고리를 포괄해야 합니다. 웨어러블 기기 데이터를 Excel 형식으로, 단일 세포 데이터를 h5ad 형식으로 처리하고, 분석을 위한 Python 코드를 생성하고, 가설 검증을 위한 PCR 실험을 설계할 수 있습니다.
* 인간과 기계의 협업에 대한 새로운 패러다임 확립:Biomni의 포지셔닝은 과학자를 대체하는 것이 아니라 "슈퍼 비서"가 되는 것입니다. 즉, 데이터 정리 및 문헌 검색과 같은 반복적인 작업을 자동으로 완료하여 연구자들이 가설 구성과 혁신적 설계에 집중할 수 있도록 하는 것입니다.
데이터 세트: 생물의학 지식 기반을 구축하기 위한 3계층 데이터 세트
Biomni의 강력한 역량은 생물의학 연구 리소스를 체계적으로 통합하는 데서 비롯됩니다. 3중 계층 데이터 세트를 구축함으로써, Biomni 팀은 도구, 데이터, 그리고 작업을 아우르는 AI를 위한 "디지털 실험실"을 구축했습니다.
생물의학 연구의 기본 운영 단위를 정의하려면연구팀은 bioRxiv의 25개 주제 분야(예: 유전체학, 미생물학, 약리학)에서 2024년에 출판된 최신 논문 100편을 선정했습니다."Action Discovery Agent"를 통해 연구 프로세스를 하나씩 분석하고, 작업, 도구, 소프트웨어 패키지, 데이터베이스라는 네 가지 핵심 요소를 추출합니다. 이 데이터베이스에는 59개의 핵심 리소스가 포함되어 있으며, 이는 두 가지 범주로 나뉩니다. API로 접근 가능한 대규모 데이터베이스(예: 단백질 구조 저장을 위한 PDB, 임상 변이 데이터베이스인 ClinVar)와 로컬로 배포되는 구조화된 데이터 세트(예: GWAS 요약 통계, 마이크로바이옴 참조 유전체)입니다.
두 번째로, 일반화 능력을 검증하기 위해 연구팀은 일반 지식 벤치마크와 실제 업무 세트로 구성된 다단계 평가 데이터 세트를 구축했습니다.일반 지식 벤치마크에는 LAB-Bench(DbQA 데이터베이스 질의응답 및 SeqQA 시퀀스 추론 포함)와 Humanity's Last Exam(생물의학 하위 분야 14개 포함)이 포함됩니다.이 데이터 세트는 특정 도구에 의존하지 않고 AI의 기본적인 추론 능력을 검토하는 데 중점을 둡니다. 실제 작업 세트는 8개의 교차 영역 작업을 포함하며, 각 작업은 실제 연구 시나리오에 해당합니다.
실제 적용 가치를 입증하기 위해,팀은 사례 연구 데이터로 세 가지 유형의 일반적인 데이터를 선택했습니다.
* 웨어러블 기기 데이터: 30명의 참가자로부터 얻은 458개의 Excel 파일, 연속 포도당 모니터링(CGM) 및 체온 데이터(식전 2시간부터 식후 4시간까지), 227일간의 수면 기록(수면 시간, 효율, 수면 단계 등 포함)
* 다중 오믹스 데이터: 인간 배아 골격 발달의 단일 세포 데이터 세트(336,000개 핵의 snRNA-seq 및 snATAC-seq 데이터), 652개 지질, 731개 대사산물, 1,470개 단백질의 다중 오믹스 데이터
* 습식 실험 데이터: 10가지 클로닝 작업(골든 게이트, 깁슨 및 기타 방법 포함)과 B2M 유전자를 표적으로 하는 CRISPR 벡터 구축 실험은 Biomni가 설계한 실험 계획을 검증하는 데 사용되었습니다.
모델 아키텍처: 듀얼 엔진 설계 및 지능형 협업 메커니즘
Biomni는 두 가지 주요 구성 요소로 이루어져 있습니다. 통합된 작업 공간을 갖춘 기본 생물의학 환경인 Biomni-E1과 이 환경을 효과적으로 활용하도록 설계된 에이전트인 Biomni-A1입니다.
* Biomni-E1은 단순한 도구 모음이 아니라, 신뢰성, 유연성, 확장성이라는 세 가지 원칙을 준수하여 설계된 체계적인 "디지털 실험실"입니다. 즉, 모든 도구, 소프트웨어 및 데이터베이스는 전문가의 검증을 거쳐야 합니다. 소프트웨어는 컨테이너 방식으로 배포되고 버전 전환을 지원하며, 데이터베이스 쿼리는 자연어 입력을 지원합니다. 또한, 예약된 인터페이스는 새로운 도구 추가를 지원합니다.
* Biomni-A1은 일반 지능의 "의사결정 센터"입니다. 이 아키텍처는 기존 AI의 "입출력" 모델을 혁신합니다. 인간 과학자와 유사한 문제 해결 프로세스를 갖추고 있으며, 검색 강화 계획에 기반한 동적 도구 선택을 수행합니다. 코드를 범용 인터페이스로 사용하고 루프, 병렬 처리, 조건부 판단과 같은 복잡한 논리를 지원합니다. 적응형 계획을 지원하며, 초기 계획은 지식을 기반으로 생성되고 실행 중 피드백에 따라 조정될 수 있습니다.

실험 결론: 벤치마크 테스트부터 습식 랩 검증까지 탁월한 성능
Biomni의 성능은 다단계 실험을 통해 검증되었으며, 그 결과는 기술적 혁신을 보여주었을 뿐만 아니라 일반 생물의학 AI의 실용적 가치를 보여주었습니다.
표준화된 벤치마크 테스트에서 Biomni는 상당한 장점을 입증했습니다.
* LAB-Bench 테스트에서는데이터베이스 질의응답(DbQA)의 정확도는 74.4%에 도달하여 인간 전문가(74.7%)와 비슷하며 코딩 에이전트(40.8%)를 크게 능가합니다. 시퀀스 추론(SeqQA)의 정확도는 81.9%에 도달하여 인간 수준(78.8%)을 넘어섰습니다. 이는 구조화된 데이터와 생물학적 시퀀스를 처리하는 능력이 전문 연구자의 수준에 가깝다는 것을 나타냅니다.
* HLE 시험에서는14개 분야에 걸친 52개 문항이 평가되었으며, 정확도는 17.3%로, 기본 LLM(6.0%)의 2.9배, 인코딩 에이전트(12.8%)의 1.3배에 달합니다. HLE는 개발 세트 튜닝이 필요 없으며, 제로 샘플 일반화 능력을 완벽하게 테스트한다는 점에 주목할 필요가 있습니다. 결과는 Biomni가 보이지 않는 교차 도메인 문제를 처리할 수 있음을 보여줍니다.
또한, 8개의 실제 작업에서Biomni의 평균 성능은 기준치를 크게 상회합니다. 기본 LLM보다 402.3%, 인코딩 에이전트보다 43.0%, ReAct 연쇄 추론만 사용하는 변형(Biomni-ReAct)보다 20.4% 더 높습니다. 분할 과제에서 GWAS 인과 유전자 검출 정확도는 68.3%(인간 전문가 평균 71.2%), 단일 세포 주석의 의미적 일치율은 89.7%, 약물 재분배의 임상적 정렬 점수는 0.78(만점 1.0)을 기록했습니다.

간단히 말해, Biomni는 "특수 직책에 특화된 사람들"이라는 기존 생의학 분야의 AI 한계를 깨고 유전자 조절 네트워크 분석부터 습식 실험 설계까지 자율적인 운영의 전 과정을 구현합니다. 이는 기술적 혁신일 뿐만 아니라, 가상 AI 생물학자가 인간 과학자와 협력하여 인간 과학자의 역량을 향상시키는 미래에 대한 비전이기도 합니다.
현재,HyperAI 공식 웹사이트(hyper.ai)의 "튜토리얼" 섹션에서 "Biomni: The First Universal Biomedical Intelligent Agent"가 출시되었습니다.원클릭 배포를 통해 온라인으로 체험해 보세요. 생물의학 작업 지침을 입력하기만 하면 자동 분석 프로세스가 시작됩니다. 지금 바로 체험해 보세요!튜토리얼 링크:
신규 가입 사용자를 위한 깜짝 혜택도 준비했습니다. 초대 코드 "Biomni"를 사용하여 OpenBayes 플랫폼에 가입하시면 RTX A6000을 5시간 동안 무료로 사용하실 수 있습니다(1개월 동안 유효). 수량이 한정되어 있어 선착순으로 제공됩니다!
데모 실행
1. hyper.ai 홈페이지에 접속한 후, "튜토리얼" 페이지를 선택하고, "Biomni: The First Universal Biomedical Agent"를 선택한 후, "이 튜토리얼을 온라인으로 실행"을 클릭하세요.


2. 페이지가 이동한 후 오른쪽 상단의 "복제"를 클릭하여 튜토리얼을 자신의 컨테이너로 복제합니다.

3. "NVIDIA RTX A6000"과 "vllm" 이미지를 선택하세요. OpenBayes 플랫폼은 4가지 결제 방식을 제공합니다. 필요에 따라 "종량제" 또는 "일일/주간/월간" 결제 방식을 선택할 수 있습니다. "계속"을 클릭하세요. 신규 사용자는 아래 초대 링크를 통해 등록하시면 RTX 4090 4시간 + CPU 무료 사용 시간 5시간을 받으실 수 있습니다!
HyperAI 독점 초대 링크(복사하여 브라우저에서 열기):
https://openbayes.com/console/signup?r=Ada0322_NR0n


4. 리소스가 할당될 때까지 기다리세요. 첫 번째 복제에는 약 2분 정도 걸립니다. 상태가 "실행 중"으로 변경되면 "작업 공간 열기"를 클릭하여 데모 페이지로 이동하세요.

5. 왼쪽 디렉터리 표시줄에서 프로젝트 이름을 두 번 클릭하여 사용을 시작하세요. "3. 자연어를 사용하여 생물의학 작업 수행"을 실행하고 프롬프트를 입력하세요.

효과 시연
예시 프롬프트: T 세포 고갈을 조절하는 유전자를 식별하기 위한 CRISPR 스크린을 계획하고, 교란 효과를 최대화하는 32개의 유전자를 생성합니다.
효과는 다음과 같습니다.


위는 HyperAI가 추천하는 튜토리얼입니다. 관심 있는 분들은 직접 체험해 보세요⬇️
튜토리얼 링크:
https://go.hyper.ai/Mox9F