DeepMol: Ein automatisiertes Maschinen- und Tiefenlernframework für die computergestützte Chemie
Das Gebiet der computergestützten Chemie hat infolge der Einführung von Machine-Learning-(ML-)Technologien eine bedeutende Entwicklung erfahren. Trotz ihres Potenzials, das Feld zu revolutionieren, sind Forscher häufig durch Hindernisse behindert, wie die Komplexität der Auswahl optimaler Algorithmen, die Automatisierung von Schritten der Datenpräverarbeitung, die Notwendigkeit anpassungsfähiger Merkmalsingenieurtechniken sowie die Gewährleistung einer konsistenten Modellleistung über verschiedene Datensätze hinweg. Um diese Herausforderungen direkt anzugehen, zeichnet sich DeepMol als automatisiertes Machine-Learning-(AutoML-)Werkzeug durch die Automatisierung entscheidender Schritte im ML-Pipeline-Prozess aus. DeepMol identifiziert schnell und automatisch die am effektivsten geeigneten Datenrepräsentationen, Präverarbeitungsmethoden und Modellkonfigurationen für eine spezifische Aufgabe der Vorhersage molekularer Eigenschaften oder Aktivitäten. Auf 22 Benchmark-Datensätzen erzielte DeepMol vergleichbare Pipelines im Vergleich zu Ansätzen, die zeitaufwändige Merkmalsingenieurtechniken, Modellentwicklung und -auswahl erfordern. Als eines der ersten AutoML-Werkzeuge, speziell für den Bereich der computergestützten Chemie entwickelt, hebt sich DeepMol durch seinen Open-Source-Code, detaillierte Tutorials, umfassende Dokumentation und Beispiele für reale Anwendungen hervor – alle unter https://github.com/BioSystemsUM/DeepMol und https://deepmol.readthedocs.io/en/latest/. Durch die Einführung von AutoML als bahnbrechende Funktion in der computergestützten Chemie etabliert sich DeepMol als wegweisendes State-of-the-Art-Werkzeug in diesem Feld.