HyperAIHyperAI
vor einem Monat

MoleculeNet: Eine Referenzdatensammlung für molekulare Maschinelles Lernen

Zhenqin Wu; Bharath Ramsundar; Evan N. Feinberg; Joseph Gomes; Caleb Geniesse; Aneesh S. Pappu; Karl Leswing; Vijay Pande
MoleculeNet: Eine Referenzdatensammlung für molekulare Maschinelles Lernen
Abstract

Das molekulare maschinelle Lernen hat in den letzten Jahren rasch Fortschritte gemacht. Verbesserte Methoden und die Verfügbarkeit größerer Datensätze haben es ermöglicht, dass maschinelle Lernalgorithmen zunehmend genaue Vorhersagen über molekulare Eigenschaften treffen können. Dennoch sind die algorithmischen Fortschritte aufgrund des Mangels an einem Standardbenchmark zur Vergleichbarkeit der Effizienz vorgeschlagener Methoden begrenzt; die meisten neuen Algorithmen werden auf unterschiedlichen Datensätzen evaluiert, was es schwierig macht, die Qualität der vorgeschlagenen Methoden einzuschätzen. Diese Arbeit stellt MoleculeNet vor, eine umfangreiche Benchmark-Plattform für molekulares maschinelles Lernen. MoleculeNet sammelt mehrere öffentliche Datensätze, legt Bewertungsmaßstäbe fest und bietet hochwertige Open-Source-Implementierungen verschiedener zuvor vorgeschlagener molekularer Merkmalsextraktionen und Lernalgorithmen (veröffentlicht als Teil der Open-Source-Bibliothek DeepChem). Die Benchmarks von MoleculeNet zeigen, dass lernfähige Darstellungen mächtige Werkzeuge für das molekulare maschinelle Lernen sind und im Allgemeinen die beste Leistung bieten. Dieses Ergebnis ist jedoch mit Einschränkungen verbunden. Lernfähige Darstellungen haben immer noch Schwierigkeiten, komplexe Aufgaben bei Datenknappheit und stark unbalancierter Klassifikation zu bewältigen. Für quantenmechanische und biophysikalische Datensätze kann die Verwendung physikbewusster Merkmalsextraktionen wichtiger sein als die Wahl eines bestimmten Lernalgorithmus.

MoleculeNet: Eine Referenzdatensammlung für molekulare Maschinelles Lernen | Neueste Forschungsarbeiten | HyperAI