HyperAIHyperAI
il y a 13 jours

MLCopilot : Libérer le pouvoir des grands modèles linguistiques pour résoudre des tâches d'apprentissage automatique

Lei Zhang, Yuge Zhang, Kan Ren, Dongsheng Li, Yuqing Yang
MLCopilot : Libérer le pouvoir des grands modèles linguistiques pour résoudre des tâches d'apprentissage automatique
Résumé

Le domaine de l’apprentissage automatique (machine learning, ML) a connu une adoption massive, entraînant une demande croissante pour adapter le ML à des scénarios spécifiques — une tâche toutefois coûteuse et complexe. Les approches dominantes visant à automatiser la résolution des tâches de ML (comme l’AutoML) sont souvent longues à mettre en œuvre et difficiles à comprendre pour les développeurs humains. En revanche, bien que les ingénieurs humains possèdent une capacité remarquable à comprendre les tâches et à raisonner sur leurs solutions, leur expérience et leurs connaissances sont souvent fragmentaires et difficiles à exploiter par des approches quantitatives. Dans cet article, nous visons à combler l’écart entre l’intelligence machine et les connaissances humaines en introduisant un cadre novateur qui exploite les modèles linguistiques à grande échelle (LLM) d’avant-garde pour concevoir des solutions de ML adaptées à de nouvelles tâches. Nous démontrons la faisabilité d’étendre les capacités des LLM afin qu’ils comprennent des entrées structurées et effectuent un raisonnement approfondi pour résoudre des tâches ML inédites. Nous constatons qu’après une conception soigneuse, les LLM peuvent (i) tirer des enseignements des expériences existantes en matière de tâches ML et (ii) raisonner efficacement pour produire des résultats prometteurs sur de nouvelles tâches. Les solutions générées peuvent être utilisées directement pour atteindre un haut niveau de performance. Des exemples et le code sont disponibles à l’adresse suivante : https://github.com/microsoft/CoML.

MLCopilot : Libérer le pouvoir des grands modèles linguistiques pour résoudre des tâches d'apprentissage automatique | Articles de recherche récents | HyperAI