15일 전
CLASS: 크로스모달 텍스트-분자 검색 성능 및 학습 효율성 향상
Hongyan Wu, Peijian Zeng, Weixiong Zheng, Lianxi Wang, Nankai Lin, Shengyi Jiang, Aimin Yang

초록
크로스모달 텍스트-분자 검색 작업은 분자 구조와 자연어 설명 간의 다리를 놓는다. 기존의 방법들은 주로 텍스트 모달리티와 분자 모달리티 간의 정렬에 초점을 맞추고 있으나, 학습 과정의 다양한 단계에서 학습 상태를 적응적으로 조정하거나 학습 효율을 향상시키는 데는 주목하지 못했다. 이러한 문제를 해결하기 위해 본 논문은 어떤 기반 모델(backbone)과도 통합 가능하며 우수한 성능 향상을 제공할 수 있는 교육 과정 학습 기반 크로스모달 텍스트-분자 학습 프레임워크(CLASS)를 제안한다. 구체적으로, 텍스트 모달리티와 분자 모달리티 양쪽을 고려하여 샘플의 난이도를 정량화하고, 학습이 진행됨에 따라 쉬운 샘플부터 어려운 샘플로 순차적으로 학습 데이터를 도입하는 샘플 스케줄러를 설계하였다. 이는 학습 초기 단계에서 학습 샘플의 규모를 크게 줄여 학습 효율을 향상시킨다. 또한, 학습이 진행됨에 따라 학습 강도를 적응적으로 증가시키는 적응형 강도 학습(adaptive intensity learning)을 도입하여, 모든 교육 과정 단계에서 학습 강도를 자동으로 조절한다. ChEBI-20 데이터셋에서의 실험 결과, 제안하는 방법이 우수한 성능을 달성함과 동시에 상당한 시간 절약 효과를 보였다.