GEOM-Drugs 3D 분자 구조 데이터 세트
GEOM-Drugs 데이터 세트는 다양한 고품질 유기 분자 구조를 포함하는 대규모 3D 분자 구조 데이터 세트입니다. 2022년 4월 21일 Multimodal Art Projection 팀에서 발표한 관련 논문 결과는 "GEOM, 머신 러닝을 위한 에너지 주석 분자 구조".
이 데이터 세트는 다운스트림 머신 러닝 작업에 사용되며, 각각 평균 44개의 원자를 포함하는 430,000개의 분자를 포함합니다. 데이터 처리 후, 각 분자는 최대 181개의 원자를 포함할 수 있습니다. 실험에서 연구진은 각 분자의 가장 낮은 에너지 형태를 30개 수집하고 각 기준 방법을 사용하여 이들 분자의 구성 원자의 3차원 위치와 유형을 생성하도록 요청했습니다.