2달 전
LDMol: 구조 정보를 포함한 텍스트-분자 확산 모델이 AR 모델을凌駕하다 注意:在最后一句中,“凌驾”这个词没有直接对应的韩文词汇,通常会根据上下文选择最合适的表达方式。在这里,可以使用“초월하다”(超越)来表示: LDMol: 구조 정보를 포함한 텍스트-분자 확산 모델이 AR 모델을 초월하다
Jinho Chang; Jong Chul Ye

초록
확산 모델이 최전선 생성 모델로 부상함에 따라 많은 연구자들이 조건부 확산 모델을 이용한 분자 생성 기술을 제안하였습니다. 그러나 분자의 불가피한 이산성은 확산 모델이 원시 데이터와 자연어와 같은 고도로 복잡한 조건을 연결하는 것을 어렵게 만듭니다. 이를 해결하기 위해 본 연구에서는 텍스트 조건부 분자 생성을 위한 새로운 잠재 확산 모델인 LDMol(잠재적 분자 모델)을 소개합니다. 적절한 잠재 공간 설계가 확산 모델의 성능에 핵심적인 역할을 한다는 점을 인식하고, 우리는 대조 학습 전략을 사용하여 텍스트 데이터에서 분자 구조의 독특한 특성을 포함하는 새로운 특징 공간을 추출하였습니다. 실험 결과, LDMol은 텍스트-분자 생성 벤치마크에서 기존의 자기 회귀 기반 방법론들을 능가하며, 잠재 영역 선택의 개선으로 텍스트 데이터 생성에서 자기 회귀 모델보다 우수한 성능을 보이는 최초의 확산 모델 중 하나임을 입증하였습니다. 또한, LDMol이 분자-텍스트 검색 및 텍스트 안내된 분자 편집과 같은 하류 작업에도 적용될 수 있음을 보여주며, 이는 LDMol의 다목적 활용 가능성을 입증합니다.