State를 이용한 다양한 환경에서 세포 반응 예측

세포의 섭동에 대한 반응은 생물학적 메커니즘을 이해하고 잠재적인 약물 표적을 선택하는 데 있어 핵심적인 역할을 합니다. 계산 모델은 실험적 접근법과 비교하여 섭동 효과를 예측하는 데 큰 잠재력을 제공하지만, 현재로서는 실험적으로 관찰된 세포 환경에서 미관찰된 환경으로 효과를 일반화하는 데 어려움이 있습니다. 이 글에서는 State라는 기계 학습 아키텍처를 소개합니다. State는 세포 내외의 섭동 실험에서 세포의 이질성을 고려하면서 섭동 효과를 예측합니다. State는 물리적 척도를 넘어서 작동합니다: 70개의 세포 환경에서 1억 개 이상의 섭동된 세포 데이터를 사용하여 여러 세포 집합 간의 섭동 효과를 학습하는 상태 전이 모델과 1억 6700만 개의 인간 세포에서 관찰된 단일 세포 데이터로 훈련된 세포 임베딩 모델로 구성됩니다. State는 다수의 대규모 데이터셋에서 섭동 효과 구분 능력을 50% 이상 향상시키고, 유전자, 신호 전달, 화학적 섭동에 걸쳐 실제 차등 발현 유전자를 기존 모델보다 2배 이상 정확하게 식별하였습니다. 또한 State는 임베딩 모델을 사용하여 훈련 중 관찰되지 않았던 새로운 세포 환경에서 강한 섭동을 식별할 수 있습니다. 우리는 또한 생물학적으로 관련 있는 지표를 사용하여 State가 특정 세포 유형에 따른 더 정밀한 섭동 반응 발견을 가능하게 하는 포괄적인 평가 프레임워크인 Cell-Eval을 소개합니다. 예를 들어, State는 세포 생존과 관련된 반응들을 더욱 정밀하게 발견할 수 있습니다. 전체적으로, State의 성능과 유연성은 가상 세포 모델 개발의 확장을 위한 기반을 마련하고 있습니다.