HyperAIHyperAI

Command Palette

Search for a command to run...

Premier agent virtuel cellulaire autonome conçu par une équipe internationale, CellForge révolutionne la modélisation biologique par l’IA

Un nouveau système multi-agents, baptisé CellForge, vient de révolutionner la conception de modèles virtuels de cellules. Développé par une équipe internationale menée par Mark Gerstein (Yale), Smita Krishnaswamy (Yale), Tang Xiangru, Zhi Huang (Penn), Cui Yan, Fang Wu (Stanford), Xi-Hong Lin (Harvard), Fabian Theis et Wang Weixu (Helmholtz Munich), ce système a été présenté dans une prépublication sur arXiv sous le titre CellForge: Agentic Design of Virtual Cell Models [1]. Il s’agit du premier système capable de concevoir automatiquement, à partir de zéro, des modèles informatiques complexes pour simuler le comportement cellulaire, en réponse à des perturbations biologiques comme l’édition génique, l’administration de médicaments ou des stimuli cellulaires. Contrairement aux approches traditionnelles qui nécessitent des années de travail manuel pour concevoir et ajuster des modèles, CellForge intègre une architecture multi-agents où chaque agent joue un rôle spécialisé : expert en données, concepteur de modèles, biologiste, ou spécialiste de l’entraînement. Ces agents collaborent via des discussions critiques itératives, simulant le processus collaboratif des équipes scientifiques réelles. Ils examinent, critiquent et affinent mutuellement leurs propositions jusqu’à converger vers une solution optimale — une approche que les chercheurs qualifient de « consensus critique ». Ce mécanisme permet non seulement d’améliorer la qualité du modèle, mais aussi de renforcer sa robustesse et sa reproductibilité, tout en réduisant les biais ou les erreurs d’hallucination fréquents dans les systèmes d’IA uniques. Le système fonctionne en trois étapes clés : 1. Analyse de la tâche : il interprète les données brutes (comme les séquençages à cellule unique scRNA-seq, scATAC-seq, CITE-seq) et les descriptions en langage naturel du problème scientifique, tout en effectuant une recherche automatique dans la littérature scientifique pour contextualiser la tâche. 2. Conception de la méthode : les agents proposent diverses architectures de réseau neuronal, stratégies d’entraînement et approches d’optimisation, puis les discutent en profondeur pour affiner la solution. 3. Exécution expérimentale : une fois le plan validé, CellForge génère automatiquement du code exécutable en Python, couvrant le prétraitement des données, l’entraînement du modèle, l’évaluation et la visualisation des résultats. Un des atouts majeurs de CellForge réside dans sa capacité à traiter des données multi-modales. Contrairement aux modèles précédents limités à une seule modalité (par exemple, seulement les données d’expression génique), CellForge analyse automatiquement le type de données fourni et adapte sa conception de modèle en conséquence. Cela lui permet de surpasser des modèles de référence comme scGPT, Geneformer ou ChemCPA sur des tâches de prédiction de perturbations, notamment dans des scénarios non vus auparavant. Des tests sur six jeux de données variés — incluant des perturbations géniques, pharmacologiques et cytokiniques — montrent que CellForge bat systématiquement les modèles existants, y compris les cadres d’automatisation scientifique généralistes comme Biomni ou DeepResearch. Ce succès s’explique par sa capacité à concevoir des architectures sur mesure, adaptées à chaque contexte biologique, plutôt que de s’appuyer sur des modèles pré-entraînés ou standardisés. L’impact potentiel de CellForge va bien au-delà de la recherche fondamentale. En permettant de prédire avec précision comment une cellule réagira à un médicament ou une modification génétique, ce système pourrait accélérer considérablement le développement de médicaments, réduire les coûts liés aux essais cliniques et améliorer la réussite des traitements dans des domaines comme la thérapie anticancéreuse, l’immunothérapie ou la régénération tissulaire. Les chercheurs soulignent que CellForge n’a pas pour objectif de remplacer les scientifiques, mais de devenir un partenaire intelligent pour l’exploration scientifique. À terme, l’équipe envisage de l’intégrer à des plateformes expérimentales automatisées, créant ainsi une boucle fermée : conception par IA → simulation virtuelle → exécution expérimentale automatique → retour d’information pour améliorer le modèle. Disponible en open source sur GitHub, CellForge marque une étape décisive vers une nouvelle ère de la science, où l’intelligence artificielle ne se contente plus d’assister, mais participe activement à la conception de nouvelles connaissances. Il s’agit d’un pas vers l’ère de l’« IA chercheur », où la découverte scientifique devient plus rapide, plus scalable et accessible à un plus large public. Références : 1. https://arxiv.org/abs/2508.02276 2. https://arxiv.org/abs/2311.10537 3. https://openreview.net/forum?id=kuhIqeVg0e

Liens associés