한 달 전
학습된 분자 표현의 특성 예측 분석
Kevin Yang; Kyle Swanson; Wengong Jin; Connor Coley; Philipp Eiden; Hua Gao; Angel Guzman-Perez; Timothy Hopper; Brian Kelley; Miriam Mathea; Andrew Palmer; Volker Settels; Tommi Jaakkola; Klavs Jensen; Regina Barzilay

초록
신경망 기술의 발전은 분자 특성 예측을 위한 다양한 알고리즘적 해결책을 제공하게 되었습니다. 특히 두 가지 모델 유형이 유망한 결과를 보여주고 있습니다: 계산된 분자 지문 또는 전문가가 설계한 설명 변수에 적용된 신경망과, 분자의 그래프 구조를 처리하여 학습된 분자 표현을 구성하는 그래프 컨볼루션 신경망입니다. 그러나 최근 문헌에서는 이 두 방법 중 어느 것이 새로운 화학 공간으로 일반화할 때 우수한지 명확히 결정하지 못하고 있습니다. 또한, 이전 연구에서는 이러한 새로운 모델들이 산업 연구 환경에서 현재 사용되고 있는 모델들과 비교될 때 거의 검토되지 않았습니다. 본 논문에서는 공개 데이터셋 19개와 산업용 프로퍼터리(proprietary) 데이터셋 16개를 대상으로 다양한 화학 엔드포인트를 아우르는 모델들의 성능을 철저히 벤치마킹합니다. 또한, 고정된 분자 설명 변수를 사용하는 모델 및 이전 그래프 신경망 구조보다 공개 및 프로퍼터리 데이터셋 모두에서 일관되게 동일하거나 우수한 성능을 보이는 그래프 컨볼루션 모델을 소개합니다. 우리의 경험적 연구 결과는 이러한 표현 기반 접근 방식이 실험 재현성 수준에 도달하지는 않았지만, 제안된 모델이 여전히 산업 워크플로에서 현재 사용되는 모델들보다 상당한 개선점을 제공함을 나타냅니다.