한 달 전

MoleculeNet: 분자 머신 러닝을 위한 벤치마크

Zhenqin Wu; Bharath Ramsundar; Evan N. Feinberg; Joseph Gomes; Caleb Geniesse; Aneesh S. Pappu; Karl Leswing; Vijay Pande
MoleculeNet: 분자 머신 러닝을 위한 벤치마크
초록

분자 머신 러닝은 최근 몇 년 동안 급속히 발전하고 있습니다. 개선된 방법론과 더 큰 데이터셋의 존재로 인해 머신 러닝 알고리즘이 분자의 특성을 점점 더 정확하게 예측할 수 있게 되었습니다. 그러나, 제안된 방법들의 효율성을 비교하기 위한 표준 벤치마크가 부족하여 알고리즘의 발전이 제한되어 왔습니다. 대부분의 새로운 알고리즘이 서로 다른 데이터셋에서 벤치마킹되기 때문에 제안된 방법들의 품질을 평가하는 것이 어려웠습니다.본 연구에서는 분자 머신 러닝을 위한 대규모 벤치마크인 MoleculeNet을 소개합니다. MoleculeNet은 여러 공개 데이터셋을 통합하고, 평가 지표를 설정하며, 이전에 제안된 다양한 분자 피처화 및 학습 알고리즘의 고품질 오픈 소스 구현을 제공합니다(DeepChem 오픈 소스 라이브러리의 일부로 출시됨). MoleculeNet 벤치마크는 학습 가능한 표현이 분자 머신 러닝에 강력한 도구이며 전반적으로 최고의 성능을 제공함을 보여줍니다. 그러나 이 결과에는 주의해야 할 사항이 있습니다.학습 가능한 표현은 여전히 데이터 부족 상황과 극단적으로 불균형한 분류 문제에서 복잡한 작업을 처리하는 데 어려움을 겪고 있습니다. 양자 역학적 및 생물 물리학적 데이터셋의 경우, 물리학에 기반한 피처화를 사용하는 것이 특정 학습 알고리즘 선택보다 더 중요할 수 있습니다.

MoleculeNet: 분자 머신 러닝을 위한 벤치마크 | 최신 연구 논문 | HyperAI초신경