2달 전

CLDR: 자연어 감독을 통한 대조적 학습 약물 반응 모델

Kun Li; Wenbin Hu
CLDR: 자연어 감독을 통한 대조적 학습 약물 반응 모델
초록

딥러닝 기반 약물 반응 예측(DRP) 방법은 약물 발견 과정을 가속화하고 연구개발 비용을 줄일 수 있습니다. 그러나 주류 방법들은 반응 회귀값을 예측하는 데 높은 정확도를 달성함에도 불구하고, 이러한 방법들의 회귀 인식 표현은 단편적이며 샘플 순서의 연속성을 포착하지 못합니다. 이 현상은 모델이 최적해가 아닌 부분적으로 최적화된 해 공간으로 최적화되어 일반화 능력이 감소하고, 약물 발견 단계에서 상당한 비용 낭비를 초래할 수 있습니다. 본 논문에서는 자연어 감독을 활용한 대조 학습 프레임워크인 \MN 을 제안합니다. \MN 은 회귀 라벨을 텍스트로 변환하여, 전통적인 모달리티(그래프, 시퀀스)와 비교하여 약물 반응 캡션 텍스트와 함께 샘플의 두 번째 모달리티로 통합합니다. 각 배치에서 한 샘플의 두 개 모달리티는 양성 쌍으로 간주되고, 다른 쌍들은 부정 쌍으로 간주됩니다. 또한 숫자 텍스트의 연속 표현 능력을 강화하기 위해 상식적인 숫자 지식 그래프가 도입되었습니다. 우리는 암 치료제 민감도 게놈학 데이터셋(Genomics of Drug Sensitivity in Cancer dataset)에서 수십만 개의 샘플을 검증하였으며, 우리의 프레임워크를 적용함으로써 DRP 방법의 평균 개선율이 7.8%에서 31.4% 사이임을 관찰하였습니다. 실험 결과는 \MN 이 표현 공간에서 샘플들을 연속 분포로 효과적으로 제약하며, 사전 학습 후 몇 에폭(fine-tuning) 만에 인상적인 예측 성능을 달성함을 입증하였습니다. 코드는 다음 링크에서 확인 가능합니다: \url{https://gitee.com/xiaoyibang/clipdrug.git}.

CLDR: 자연어 감독을 통한 대조적 학습 약물 반응 모델 | 최신 연구 논문 | HyperAI초신경