HyperAIHyperAI
vor 13 Tagen

MLCopilot: Die Kraft großer Sprachmodelle zur Lösung von Maschinelles Lernen-Aufgaben freisetzen

Lei Zhang, Yuge Zhang, Kan Ren, Dongsheng Li, Yuqing Yang
MLCopilot: Die Kraft großer Sprachmodelle zur Lösung von Maschinelles Lernen-Aufgaben freisetzen
Abstract

Der Bereich des maschinellen Lernens (Machine Learning, ML) hat eine breite Verbreitung erfahren und führt zu einem erheblichen Bedarf an der Anpassung von ML-Ansätzen an spezifische Szenarien – ein Prozess, der jedoch weiterhin kostspielig und nicht trivial ist. Die vorherrschenden Ansätze zur Automatisierung der Lösung von ML-Aufgaben (z. B. AutoML) sind oft zeitaufwendig und für menschliche Entwickler schwer nachvollziehbar. Im Gegensatz dazu verfügen menschliche Ingenieure über eine bemerkenswerte Fähigkeit, Aufgaben zu verstehen und Lösungsstrategien zu entwickeln; ihre Erfahrungen und ihr Wissen sind jedoch oft begrenzt und schwer durch quantitative Methoden nutzbar. In diesem Paper zielen wir darauf ab, die Kluft zwischen maschinereller Intelligenz und menschlichem Wissen zu überbrücken, indem wir einen neuartigen Rahmen vorstellen, der State-of-the-Art-Größensprachmodelle (Large Language Models, LLMs) nutzt, um ML-Lösungen für neue Aufgaben zu entwickeln. Wir zeigen die Möglichkeit, die Fähigkeit von LLMs zu erweitern, strukturierte Eingaben zu verstehen und umfassend zu reflektieren, um neue ML-Aufgaben zu lösen. Zudem stellen wir fest, dass sich nach gezielter Gestaltung das LLM (i) aus bestehenden Erfahrungen mit ML-Aufgaben ableiten und (ii) effektiv schließen lässt, um vielversprechende Ergebnisse für neue Aufgaben zu erzielen. Die generierten Lösungen können direkt eingesetzt werden, um hohe Wettbewerbsfähigkeit zu erreichen. Beispiele und Quellcode sind unter https://github.com/microsoft/CoML verfügbar.

MLCopilot: Die Kraft großer Sprachmodelle zur Lösung von Maschinelles Lernen-Aufgaben freisetzen | Neueste Forschungsarbeiten | HyperAI