한 달 전
N-Gram 그래프: 그래프의 단순 비지도 표현 및 분자에 대한 응용
Shengchao Liu; Mehmet Furkan Demirel; Yingyu Liang

초록
최근 기계 학습 기술이 의학, 생물학, 화학, 재료 공학 등 다양한 분야에서 활용되고 있습니다. 중요한 과제 중 하나는 분자의 특성을 예측하는 것입니다. 이는 가상 스크리닝 및 약물 설계와 같은 다운스트림 응용 프로그램의 주요 하위 루틴으로 작용합니다. 이러한 관심이 증가하고 있지만, 핵심적인 도전 과제는 학습 알고리즘을 위한 적절한 분자 표현을 구축하는 것입니다. 본 논문에서는 단순한 비지도 학습 방식인 N-그램 그래프(N-gram graph)를 소개합니다. 이 방법은 먼저 분자 그래프의 정점을 임베딩(embeds)합니다. 그런 다음 그래프 내에서 짧은 경로를 따라 정점 임베딩을 조립하여 그래프의 축약된 표현을 구축합니다. 이 과정은 간단한 그래프 신경망과 동일하며, 훈련이 필요하지 않습니다. 따라서 이러한 표현들은 효율적으로 계산될 수 있으며, 지도 학습 방법과 함께 사용하여 예측에 활용할 수 있습니다. 10개의 벤치마크 데이터셋에서 60개의 작업을 수행한 실험 결과, 인기 있는 그래프 신경망과 전통적인 표현 방법 모두보다 우수함을 입증하였습니다. 또한 이론적 분석을 통해 강력한 표현력과 예측 능력을 보여주고 있습니다.