DeepMol: 계산 화학을 위한 자동화된 머신러닝 및 딥러닝 프레임워크
계산 화학 분야는 머신러닝(Machine Learning, ML) 기술의 도입으로 인해 상당한 진화를 겪어왔다. 이 기술은 이 분야를 혁신적으로 변화시킬 잠재력을 지니고 있지만, 연구자들은 최적의 알고리즘을 선택하는 복잡성, 데이터 전처리 단계의 자동화 부족, 적응형 특징 공학(feature engineering)의 필요성, 그리고 다양한 데이터셋 간 모델 성능의 일관성 확보 등 다양한 장애물에 직면해 있다. 이러한 문제들을 직접 해결하기 위해 DeepMol은 머신러닝 파이프라인의 핵심 단계를 자동화하는 자동 머신러닝(AutoML) 도구로 두각을 나타낸다. DeepMol은 특정 분자 성질 또는 활성 예측 문제에 대해 빠르고 자동으로 가장 효과적인 데이터 표현 방식, 전처리 방법, 모델 구성 요소를 탐색한다. 22개의 벤치마크 데이터셋에서 DeepMol은 수작업으로 특징 공학, 모델 설계 및 선택 과정을 거쳐야 하는 기존 방법과 비교해 경쟁력 있는 파이프라인을 도출하였다. 계산 화학 분야를 전용으로 개발된 최초의 AutoML 도구 중 하나로서, DeepMol은 오픈소스 코드, 심층적인 튜토리얼, 자세한 문서화, 실제 응용 사례 등을 제공하며, https://github.com/BioSystemsUM/DeepMol 및 https://deepmol.readthedocs.io/en/latest/에서 모두 공개하고 있다. 계산 화학 분야에 AutoML을 획기적인 기능으로 도입함으로써, DeepMol은 이 분야에서 선도적인 최첨단 도구로서의 입지를 굳건히 하고 있다.