2달 전

분자 지문의 조합을 통한 ADMET 특성 예측

James H. Notwell; Michael W. Wood
분자 지문의 조합을 통한 ADMET 특성 예측
초록

소분자 활성도 예측 방법을 조사하는 과정에서, 확장 연결 지문(ECFP)과 결합된 랜덤 포레스트 또는 서포트 벡터 머신이 최근 개발된 방법들보다 일관되게 우수한 성능을 보임을 발견했습니다. 회귀 알고리즘과 분자 지문에 대한 상세한 조사를 통해, ECFP, Avalon, 그리고 ErG 지문의 조합과 200개의 분자 특성을 사용한 그래디언트 부스팅 결정 트리, 특히 CatBoost가 가장 효과적임을 확인하였습니다. 그래프 신경망 지문을 추가함으로써 성능이 더욱 향상되었습니다. 우리는 22개의 치료제 데이터 공동체(Therapeutics Data Commons) ADMET 벤치마크를 통해 모델을 성공적으로 검증하였습니다. 우리의 연구 결과는 정확한 특성 예측을 위해 더 풍부한 분자 표현의 중요성을 강조합니다.