11일 전
구조에서 성질로: 화학 원소 임베딩과 딥러닝 기반의 정확한 화학 성질 예측
Shokirbek Shermukhamedov, Dilorom Mamurjonova, Michael Probst

초록
화학 분류 작업을 위한 elEmBERT 모델을 제안한다. 이 모델은 다층 인코더 아키텍처를 포함한 딥러닝 기술에 기반하고 있으며, 유기 화합물, 무기 화합물 및 결정성 화합물의 집합에 대해 제안된 접근 방식이 제공하는 가능성을 입증한다. 특히, 결정 물성 및 약물 설계 관련 벤치마크를 포함하는 Matbench 및 Moleculenet 벤치마크를 활용하여 모델을 개발하고 테스트하였다. 또한 화학 화합물의 벡터 표현을 분석함으로써 구조 데이터 내부의 잠재적 패턴에 대한 통찰을 제공한다. 본 모델은 뛰어난 예측 능력을 보이며, 분자 및 물질 데이터셋에 있어 보편적으로 적용 가능함을 입증한다. 예를 들어, Tox21 데이터셋에서 평균 정밀도 96%를 달성하여 기존 최고 성능보다 10% 이상 우수한 성능을 보였다.