Hackathon mondial donne vie à des IA sur mesure pour la science des matériaux et la découverte de médicaments
En 2023, alors que sa famille partait en vacances, Ben Blaiszik, scientifique des données formé en sciences des matériaux et spécialiste du machine learning à l’Université de Chicago, a organisé un hackathon mondial. Sensible au potentiel transformateur de l’intelligence artificielle (IA) dans son domaine d’origine, il a voulu accélérer l’exploration de ces nouvelles possibilités par une compétition collaborative. La troisième édition de cet événement, tenue récemment à Berlin et dans plusieurs autres lieux, a réuni plus de 1200 chercheurs et développeurs du monde entier. Sur 48 heures, et avec l’aide de nombreuses pizzas, des équipes virtuelles et physiques ont exploité des modèles linguistiques massifs (LLM) pour des applications en sciences des matériaux et découverte de médicaments. Plus de 100 équipes ont présenté des vidéos de deux minutes, certaines d’un niveau proche du cinéma d’animation, illustrant des projets allant de la génération d’hypothèses à la prédiction des propriétés matérielles. Tous les travaux seront compilés dans une publication démontrant le potentiel de l’IA, tout en mettant en lumière un défi majeur : la nécessité de pipelines spécialisés pour collecter et standardiser les données scientifiques. Pepe Márquez, scientifique des matériaux à l’Université Humboldt, a organisé le site de Berlin. Il souligne que l’événement sert de catalyseur pour l’innovation, offrant aux chercheurs une pause dans leur routine pour expérimenter librement. Les LLM comme ChatGPT fonctionnent en analysant de vastes volumes de données textuelles pour générer des réponses cohérentes. Bien qu’ils permettent de libérer des données piégées dans des articles scientifiques à une échelle inédite, ils ne sont pas immédiatement fiables en contexte scientifique. Ils doivent être ajustés, ce qui exige une collaboration interdisciplinaire. Daniel Speckhard, doctorant en physique à Humboldt, sans expérience préalable en LLM, a rejoint une équipe pluridisciplinaire pour tester la capacité d’un modèle Google (T5) à prédire la relaxation des structures cristallines vers leur état d’énergie minimale. En fine-tunant le modèle avec des données de cristallographie, l’équipe a obtenu des résultats prometteurs en peu de temps. Ce qui a surpris Speckhard, c’est la rapidité avec laquelle l’IA a permis d’automatiser des tâches complexes — comme l’écriture de code — qu’il aurait mises des semaines à accomplir seul. Il a changé d’avis : « Avant, je pensais que l’IA ruinait le plaisir de la recherche. Maintenant, je suis convaincu qu’elle peut être un véritable partenaire. » D’autres équipes ont conçu des agents IA pour des problèmes concrets, comme le suivi de la chaîne d’approvisionnement dans la fabrication de médicaments ou de matériaux, en extrayant des informations de documents dispersés pour créer des balises numériques. D’autres ont utilisé des LLM open source pour concevoir de nouveaux composés chimiques à partir de structures moléculaires 3D, ou ont développé des chatbots « copilotes » capables de proposer des hypothèses de recherche en appelant des outils d’IA chimique. Márquez met en avant la plateforme NOMAD, développée par son équipe depuis dix ans, qui regroupe plus de 19 millions d’entrées pour plus de 4 millions de matériaux. Certains équipes ont conçu des chatbots pour guider les utilisateurs sur NOMAD, d’autres des outils d’extraction automatique de données pour enrichir la base. Ana Velázquez, « gestionnaire de données » au Helmholtz-Zentrum Berlin, aide les chercheurs à intégrer ces outils dans leurs workflows : « Mon rôle est de rendre la numérisation facile. Une fois tout configuré, ils déplacent un fichier, et c’est magique. » Actuellement, 32 juges experts du monde académique et industriel évaluent les projets. Blaiszik prévoit de mettre en relation les gagnants avec des mentors et des investisseurs pour industrialiser leurs prototypes. Mais au-delà des résultats, l’événement a réaffirmé l’importance du travail collaboratif dans un contexte où l’IA risque de favoriser l’isolement. Comme le souligne Kutlualp Tazefidan, développeur au Bundesinstitut für Materialforschung : « L’IA peut tout faire seul, mais nous avons besoin de ces événements pour rester humains. » À la fin, alors qu’une équipe luttait contre une baisse de sucre, Tazefidan a simplement dit : « Pas de problème, je demande à ChatGPT. »
