9일 전

BioAct-Het: 새로운 생물활성 표현을 활용한 생물활성 예측을 위한 이질적 시엠식 신경망

{and Fatemeh Zare-Mirakabad, Ghasem Pishgahi, Mohammad Akbari, Zahra Ghorbanali, Mehdi Paykan Heyrati}
초록

실험 과정에서 저생물활성으로 인한 약물 실패는 중요한 도전 과제로 남아 있다. 이러한 위험을 완화하고 화합물의 생물활성을 향상시키기 위해 리드 최적화 단계에서 생물활성 클래스를 예측하는 것은 필수적이다. 기존의 구조-활성 관계(SAR) 연구들은 화합물의 화학 구조와 생물활성 간의 연관성을 강조하고 있으나, 이러한 연구들은 화합물과 생물활성 간의 복잡한 관계를 충분히 고려하지 못하며, 화학 구조 외에도 다양한 요인이 포함된 복합적 관계를 간과하는 경향이 있다. 이러한 문제를 해결하기 위해 본 연구에서는 이질적 사이모이즈 신경망(heterogeneous siamese neural network)을 활용하여 약물과 생물활성 클래스 간의 복잡한 관계를 모델링하고, 이를 통합된 은닉 공간(latent space)에 매핑하는 BioAct-Het 모델을 제안한다. 특히, 새로운 생물활성 클래스 표현 방식인 Bio-Prof을 도입하고, 기존 생물활성 데이터셋을 개선하여 데이터 부족 문제를 완화하였다. 이러한 혁신적인 접근 방식으로 인해 본 모델은 기존 모델들을 상회하는 성능을 달성하였다. BioAct-Het 모델의 평가는 세 가지 독립적인 전략—연관성 기반, 생물활성 클래스 기반, 화합물 기반—을 통해 수행되었다. 연관성 기반 전략은 지도학습 기반 분류 기법을 사용하였고, 생물활성 클래스 기반 전략은 후향적 연구 평가 방식을 채택하였다. 반면, 화합물 기반 전략은 메타학습(meta-learning)의 개념과 유사한 특성을 보였다. 또한, 바르코미신과 올세타미비르를 이용한 코로나19 치료 적용 사례 및 몰누피라비르의 코로나19 환자 치료 잠재적 효능에 대한 사례 연구를 통해 모델이 실제 문제 해결에 얼마나 효과적인지를 분석하였다. 본 논문의 기반 데이터 및 코드는 https://github.com/CBRC-lab/BioAct-Het 에 공개되어 있으며, 데이터셋은 공개된 출처에서 유래된 것이다.

BioAct-Het: 새로운 생물활성 표현을 활용한 생물활성 예측을 위한 이질적 시엠식 신경망 | 최신 연구 논문 | HyperAI초신경