HyperAIHyperAI
vor 2 Monaten

Therapeutics Data Commons: Maschinelles Lernen-Datensätze und Aufgaben für die Arzneimittelforschung und -entwicklung

Kexin Huang; Tianfan Fu; Wenhao Gao; Yue Zhao; Yusuf Roohani; Jure Leskovec; Connor W. Coley; Cao Xiao; Jimeng Sun; Marinka Zitnik
Therapeutics Data Commons: Maschinelles Lernen-Datensätze und Aufgaben für die Arzneimittelforschung und -entwicklung
Abstract

Maschinelles Lernen in der Therapeutik ist ein aufstrebendes Gebiet mit unglaublichen Chancen für Innovation und Wirkung. Jedoch erfordert der Fortschritt in diesem Bereich die Formulierung sinnvoller Lernaufgaben und eine sorgfältige Kuration von Datensätzen. Hier stellen wir den Therapeutics Data Commons (TDC) vor, die erste einheitliche Plattform zur systematischen Nutzung und Bewertung des maschinellen Lernens im gesamten Spektrum der Therapeutik. Der TDC umfasst bislang 66 künstliche-Intelligenz-fähige Datensätze, die sich auf 22 Lernaufgaben verteilen und den Prozess der Entdeckung und Entwicklung sicherer und wirksamer Medikamente abdecken. Der TDC bietet zudem ein Ökosystem aus Werkzeugen und Gemeinschaftsressourcen, darunter 33 Datenfunktionen und Arten sinnvoller Datenaufteilungen, 23 Strategien zur systematischen Modellbewertung, 17 Molekülerzeugungsorakel und 29 öffentliche Leaderboards. Alle Ressourcen sind in einer offenen Python-Bibliothek integriert und zugänglich. Wir führen umfangreiche Experimente auf ausgewählten Datensätzen durch, die zeigen, dass selbst die stärksten Algorithmen bei der Bewältigung wichtiger therapeutischer Herausforderungen versagen, einschließlich realer Verteilungsverschiebungen in Datensätzen, multiskaliger Modellierung heterogener Daten und robuster Generalisierung auf neue Datenpunkte. Wir sehen vor, dass der TDC algorithmische und wissenschaftliche Fortschritte fördern kann und die Entwicklung, Validierung und Umsetzung von maschinellen-Lernmodellen in die biomedizinische und klinische Praxis erheblich beschleunigen wird. Der TDC ist eine Initiative des Open Science, verfügbar unter https://tdcommons.ai.

Therapeutics Data Commons: Maschinelles Lernen-Datensätze und Aufgaben für die Arzneimittelforschung und -entwicklung | Neueste Forschungsarbeiten | HyperAI