2달 전
신경망 시퀀스-투-시퀀스 모델을 사용한 역합성 반응 예측
Bowen Liu; Bharath Ramsundar; Prasad Kawthekar; Jade Shi; Joseph Gomes; Quang Luu Nguyen; Stephen Ho; Jack Sloane; Paul Wender; Vijay Pande

초록
우리는 후향 합성 반응 예측 작업을 시퀀스-투-시퀀스 매핑 문제로 다루는 완전히 데이터 주도의 모델을 설명합니다. 이 모델은 두 개의 순환 신경망으로 구성된 인코더-디코더 아키텍처를 가지며, 이는 기계 번역과 같은 다른 시퀀스-투-시퀀스 예측 작업에서 큰 성공을 거둔 바 있습니다. 모델은 미국 특허 문헌에서 얻은 50,000개의 실험적 반응 사례를 통해 훈련되었으며, 이들은 의약 화학자들이 일반적으로 사용하는 10가지 광범위한 반응 유형을 포함합니다. 우리는 우리의 모델이 규칙 기반 전문 시스템 베이스라인 모델과 유사한 성능을 보임을 확인하였으며, 또한 규칙 기반 전문 시스템과 규칙 기반 전문 시스템 요소를 포함하는 모든 머신 러닝 접근 방식에 따른 특정 제한들을 극복함을 발견하였습니다. 우리의 모델은 계산 후향 합성 분석이라는 어려운 문제 해결에 중요한 첫걸음을 내딛는 것입니다.