화학 분자 특성 예측을 위한 새로운 머신러닝 앱 출시
화학 연구자들이 분자의 특성을 예측하는 데 도움을 줄 수 있는 새로운 기계학습 애플리케이션이 등장했다. 대부분의 화학 연구자들이 공통적으로 목표로 하는 것은 분자의 물리적 특성, 예를 들어 끓는점이나 녹는점을 예측하는 것이다. 이 예측을 통해 연구자들은 새로운 약물이나 소재 개발과 같은 중요한 발견으로 나아갈 수 있다. 그러나 기존의 전통적인 방법은 시간과 장비 손상, 그리고 비용이 많이 들기 때문에 연구에 많은 부담을 주었다. 이에 따라 인공지능의 한 분야인 기계학습(ML)이 등장했다. 기계학습은 분자 특성 예측에 있어 연구자의 부담을 줄였지만, 효과적인 도구는 사용자가 높은 수준의 프로그래밍 능력을 필요로 하기 때문에 많은 화학 연구자에게 접근이 어렵다. MIT의 McGuire 연구 그룹의 연구자들이 이러한 문제를 해결하기 위해 ChemXploreML이라는 사용자 친화적인 데스크탑 애플리케이션을 개발했다. 이 애플리케이션은 프로그래밍 지식 없이도 분자 특성을 예측할 수 있도록 설계되었으며, 무료로 제공되며 주요 플랫폼에서 쉽게 다운로드 및 사용이 가능하다. 또한, 이 앱은 완전히 오프라인으로 작동하여 연구 데이터의 기밀성을 유지할 수 있다. 이 기술은 최근 Journal of Chemical Information and Modeling에 발표된 논문에서 소개되었다. 화학 기계학습의 주요 장애물 중 하나는 분자 구조를 컴퓨터가 이해할 수 있는 수치로 변환하는 것이다. ChemXploreML은 강력한 내장형 "분자 임베더"를 통해 이 복잡한 과정을 자동화한다. 이 기능은 분자 구조를 정보를 담은 수치 벡터로 변환하여, 이후 최첨단 알고리즘을 사용해 끓는점이나 녹는점과 같은 분자 특성을 정확하게 예측한다. 사용자는 직관적인 그래픽 인터페이스를 통해 이 과정을 쉽게 수행할 수 있다. "ChemXploreML의 목표는 화학 과학에서 기계학습의 접근성을 높이는 것이다."라고 McGuire 연구소의 박사후 연구원이자 논문의 주저인 Aravindh Nivas Marimuthu는 말했다. "직관적이고 강력하며 오프라인 기능을 가진 데스크탑 애플리케이션을 통해, 프로그래밍 능력이 부족한 화학 연구자들도 최첨단 예측 모델링을 사용할 수 있게 되었다. 이 연구는 새로운 약물과 소재 개발을 가속화하는 데 기여하며, 선별 과정을 더 빠르고 저렴하게 만든다. 또한, 유연한 설계 덕분에 미래 혁신의 가능성을 열어준다." ChemXploreML은 향후 기술과 알고리즘의 발전에 따라 지속적으로 업데이트될 수 있도록 설계되어, 연구자들이 언제나 최신 방법을 사용할 수 있도록 한다. 이 애플리케이션은 유기 화합물의 다섯 가지 주요 분자 특성, 즉 녹는점, 끓는점, 증기압, 임계온도, 임계압에 대해 테스트되었으며, 임계온도 예측에서는 최대 93%의 정확도를 달성했다. 또한 연구자들은 분자를 표현하는 새로운 더 간단한 방법인 VICGAE가 기존의 Mol2Vec과 거의 동일한 정확도를 보였지만, 10배 더 빠르게 작동함을 보여주었다. Marimuthu는 "우리는 미래에 연구자가 쉽게 기계학습을 사용해 고유한 문제를 해결할 수 있는 세상을 상상한다. 예를 들어 지속 가능한 소재 개발이나 우주 공간의 복잡한 화학을 탐구하는 데 기계학습을 활용할 수 있을 것이다."라고 말했다. 그의 논문에는 MIT 화학과의 1943년 졸업생 기념 연구소 부교수이자 논문의 공동 저자인 Brett McGuire도 참여했다.