HyperAI초신경
Back to Headlines

SYNCOGEN, 3D 분자 생성과 합성 경로 통합

9일 전

3D 분자 생성에서 합성 가능성의 한계를 극복하기 위한 새로운 기계 학습 프레임워크인 SYNCOGEN이 개발되었다. 기존의 생성 분자 설계 모델은 화학 공간을 확장하는 데 기여했지만, 많은 AI 생성 분자가 실험실에서 합성하기 어렵거나 불가능한 경우가 많아 실제 약물 개발이나 재료 설계에 제한이 있었다. 이전의 템플릿 기반 방법은 반응 템플릿을 기반으로 한 합성 트리 생성에 초점을 맞췄지만, 이는 2차원 분자 구조만을 고려하고 3차원 구조 정보를 반영하지 못해 생물학적 작용을 정확히 예측하는 데 어려움이 있었다. SYNCOGEN은 이러한 문제를 해결하기 위해 3D 구조와 반응 경로를 동시에 모델링하는 혁신적인 접근법을 제안했다. 연구자들은 토론토 대학교, 케임브리지 대학교, 매길 대학교 등에서 참여한 팀이 이 프레임워크를 개발했으며, 생성된 분자가 단순히 물리적으로 타당할 뿐만 아니라 실험적으로 합성 가능한지를 보장한다. 이를 위해 SYNCOGEN은 분자 구조와 합성 경로를 동시에 고려해 3D 구조를 생성하고, 합성 가능성을 보장하는 새로운 방식을 제공한다. 이 프레임워크의 핵심 기술 중 하나는 SYNSPACE 데이터셋으로, 60만 개 이상의 합성 가능한 분자와 3.3백만 개의 에너지 최소화된 3D 구조를 포함하고 있다. 이 데이터셋은 93개의 상업용 구조 블록과 19개의 안정적인 반응 템플릿을 기반으로 구성되어 있으며, 생성 모델의 학습을 위해 사용된다. SYNCOGEN은 SEMLAFLOW라는 SE(3) 등변 신경망을 기반으로 하여 반응 경로와 원자 좌표를 동시에 모델링한다. 학습 과정에서는 그래프 마스킹과 좌표 흐름 매칭을 결합하고, 화학적 유효성과 기하학적 현실성을 유지하기 위해 교차 엔트로피, 평균 제곱 오차, 쌍별 거리 페널티 등을 사용한다. 또한, 학습 시 엣지 수 제한과 호환성 마스킹 같은 제약 조건을 적용해 합성 가능한 분자를 생성한다. SYNCOGEN은 무조건적 3D 분자 생성에서 최고 수준의 성능을 보이며, 기존의 원자 기반 및 그래프 기반 생성 모델보다 우수한 결과를 기록했다. 특히, 복잡한 약물의 유사체를 생성하는 분자 인페인팅 작업에서 경쟁력 있는 성능을 보여주며, 결합 점수와 역합성 추적 가능성을 갖춘 후보 분자를 생성할 수 있다. 이는 기존 3D 생성 모델이 달성하지 못했던 성과다. 이 프레임워크는 약물 설계, 분자 조각 연결, 자동 합성 플랫폼 등 다양한 분야에서 활용될 수 있으며, 향후 방향은 특정 특성이나 단백질 결합 부위에 조건을 붙인 생성, 반응 및 구조 블록 확장, 실험실 로봇과의 통합 등을 포함한다. SYNCOGEN은 분자 설계의 현실성과 실험 가능성 사이의 격차를 해소함으로써, 약물 발견과 재료 과학에 혁신을 가져올 것으로 기대된다. 산업 전문가들은 SYNCOGEN이 분자 생성 기술의 발전을 가속화할 수 있는 중요한 단계라고 평가한다. 특히, 3D 구조와 합성 경로를 동시에 고려하는 방식은 기존의 접근법과 차별화되며, 실제 실험에 적용 가능한 분자 설계를 가능하게 한다. 연구팀은 다양한 학술 기관 및 기업에서 참여한 것으로, 이 기술이 약물 개발 및 화학 분야에 큰 영향을 미칠 것으로 기대된다.

Related Links