2달 전

분자 다중모드 기초 모델: 분자 그래프와 자연어의 연관성 연구

Bing Su; Dazhao Du; Zhao Yang; Yujie Zhou; Jiangmeng Li; Anyi Rao; Hao Sun; Zhiwu Lu; Ji-Rong Wen
분자 다중모드 기초 모델: 분자 그래프와 자연어의 연관성 연구
초록

인공지능(AI)은 다양한 분야에서 분자 이해에 있어 상당한 진전을 이룩하였지만, 기존 모델들은 일반적으로 단일 분자 모드로부터 단일 인지 능력을 획득합니다. 분자의 지식 계층이 깊기 때문에, 인간조차 직관적인 도표와 전문적 텍스트를 포함한 다양한 모드에서 학습하여 이해를 돕습니다. 이러한 점에서 영감을 받아, 우리는 대조학습을 통해 출판된 과학논문 인용색인(SCI) 논문에서 수집된 분자 그래프와 의미적으로 관련된 텍스트 데이터로 사전 학습된 분자 다중모달 기초 모델을 제안합니다. 이 AI 모델은 분자 그래프와 자연어를 직접 연결하는 중요한 시도를 나타냅니다. 특히, 두 모달의 특정하고 보완적인 정보를 포착함으로써 제안된 모델은 분자 전문성을 더 잘 파악할 수 있습니다. 실험 결과는 우리의 모델이 크로스모달 검색과 분자 캡션 생성 등의 크로스모달 작업에서 유망한 성능을 보여주며, 동시에 분자 특성 예측을 개선하고 자연어 설명으로부터 의미 있는 분자 그래프를 생성할 수 있는 능력을 갖추고 있음을 입증하였습니다. 우리는 이 모델이 생물학, 화학, 재료과학, 환경과학, 의학 등 여러 학문 간의 AI 활용 분야에 광범위한 영향을 미칠 것이라고 믿습니다.

분자 다중모드 기초 모델: 분자 그래프와 자연어의 연관성 연구 | 최신 연구 논문 | HyperAI초신경