DeepMind用AI自动生成87种基因组学新方法,Kaggle竞赛击败84%人类选手
DeepMind, en collaboration avec le MIT et Harvard, a récemment publié une étude de 71 pages révolutionnaire, démontrant qu’un système d’intelligence artificielle peut automatiser la création de logiciels scientifiques de haut niveau. Ce système, combinant un grand modèle linguistique (LLM) et une stratégie de recherche arborescente (tree search), est capable de générer, itérer et améliorer des programmes de recherche en quelques heures à quelques jours — une tâche que les chercheurs humains mettraient généralement des mois à accomplir. L’approche repose sur une vision nouvelle de la recherche scientifique : les problèmes scientifiques complexes peuvent être formulés comme des « tâches évaluables » (scorable tasks), c’est-à-dire des défis résolus par des logiciels conçus pour optimiser un indicateur de performance spécifique. Ces logiciels, appelés « logiciels empiriques », sont au cœur de nombreuses disciplines — modélisation chimique, prévision météorologique, analyse spatiale, neurosciences, prédiction de séries temporelles, etc. L’objectif du système est de produire automatiquement des solutions logicielles de qualité experte, en explorant systématiquement un vaste espace de solutions. Le processus commence par une description du problème, un indicateur de performance et des données. Le LLM génère alors des premiers scripts Python, qui sont exécutés dans un environnement sécurisé pour obtenir une note de qualité. Ensuite, l’algorithme de recherche arborescente, basé sur une version améliorée de PUCT (inspirée de AlphaZero), choisit les meilleurs candidats à explorer davantage, en équilibrant exploration (découverte de nouvelles idées) et exploitation (amélioration des meilleures solutions connues). Une caractéristique clé réside dans la capacité du système à intégrer activement des idées provenant de sources externes : articles scientifiques, manuels, moteurs de recherche (comme Gemini Deep Research ou des assistants IA scientifiques). Ces informations enrichissent les prompts du LLM, guidant la génération de code vers des solutions plus innovantes. Les performances ont été testées sur 16 défis Kaggle de 2023, où le système a surpassé non seulement les appels uniques au LLM, mais aussi les meilleurs résultats obtenus après 1000 essais. L’approche avec recherche arborescente a permis des sauts significatifs dans les scores, démontrant une capacité d’innovation continue. L’ajout de conseils experts ou de contraintes spécifiques (par exemple, implémenter un arbre de décision sans utiliser des bibliothèques standard) a encore amélioré les résultats. Dans le domaine de la génomique, le système a été testé sur la correction des effets de batch dans les données de séquençage à cellule unique (scRNA-seq), un défi majeur en biologie computationnelle. Sur le benchmark OpenProblems, il a proposé 87 nouvelles méthodes, dont 40 ont surpassé les meilleures solutions humaines. Le modèle BBKNN (TS), issu d’une combinaison stratégique de méthodes existantes, a amélioré les performances de 14 % par rapport à l’état de l’art. En neurosciences, le système a été confronté à la prédiction de l’activité de plus de 70 000 neurones chez le poisson-zèbre (ZAPBench). Il a surpassé tous les modèles de référence, y compris un modèle Unet avancé, en particulier dans les prédictions à court terme. Il a conçu des architectures complexes intégrant des caractéristiques temporelles, des embeddings neuronaux spécifiques et un « état global du cerveau » appris. Une intégration exploratoire avec Jaxley, une bibliothèque de simulation neuronale biophysique, a même permis d’améliorer la lisibilité et l’interprétabilité des modèles. Ces résultats ne sont pas seulement une avancée technique : ils ouvrent la voie à une nouvelle ère de la science, où l’IA ne se contente pas de traiter des données, mais participe activement à la conception de méthodes scientifiques, en combinant empirisme et connaissances fondamentales. Ce système représente une voie générale et réplicable pour accélérer la découverte scientifique à grande échelle.
