La complexité physique du génome humain défie l'IA
Depuis le séquençage du génome humain, les scientifiques cherchent à décrypter ses mécanismes. Loin d’un simple code génétique ou d’une feuille de route statique, le génome s’avère être un système de régulation d’une complexité exceptionnelle. Seuls deux pour cent de l’ADN codent pour les protéines. Le reste gère l’activation et la désactivation des gènes selon le type cellulaire, le moment et l’environnement. Cette régulation fait intervenir des facteurs de transcription, des enhanceurs dispersés sur de longues distances, et des structures chromosomiques tridimensionnelles en constante mutation. L’architecture physique de l’ADN, modifiée par des marques épigénétiques et des interactions spatiales, détermine ainsi son activité bien plus que sa simple séquence linéaire. Face à cette complexité, l’intelligence artificielle s’impose comme un outil prometteur. Des modèles génomiques fondés comme AlphaGenome, Evo 2 ou Genos sont entraînés sur d’immenses bases de données pour prédire l’impact des variations génétiques sur les traits biologiques et les risques de maladie. Ces algorithmes ne tentent pas de reconstituer manuellement chaque étape de la régulation ; ils en apprennent les corrélations indirectes via l’apprentissage automatique. Bien que ces systèmes offrent des prédictions utiles, ils traitent la régulation biologique comme une boîte noire. Or, le génome humain ne fonctionne pas selon une logique algorithmique prédictible. Son fonctionnement repose sur une combinaison flexible de signaux, une mémoire contextuelle et des adaptations en temps réel, similaires à ce que décrit la lauréate du prix Nobel Barbara McClintock en le qualifiant d’organe cellulaire hautement sensible. Les chercheurs mettent en garde contre les limites de cette approche purement computationnelle. La biologiste Wendy Bickmore souligne que les modèles actuels peinent à intégrer la diversité des types cellulaires, l’évolution développementale et les influences externes comme le régime alimentaire, le microbiote ou l’environnement. L’expérimentateur Adrian Woolfson appelle cet ensemble de données extrasgénétiques l’informiome, soulignant que la séquence d’ADN seule ne suffit pas à prédire les effets biologiques réels. De plus, la régulation post-transcriptionnelle, impliquant des ARN non codants et l’épissage alternatif, ajoute une couche supplémentaire de variabilité contextuelle. Plutôt que de chercher à remplacer la compréhension biologique par des prédictions algorithmiques, les experts estiment que l’intelligence artificielle doit servir de complément au raisonnement humain. Les chercheurs comme Karen Adelman insistent sur la nécessité de développer des cadres théoriques intégrant à la fois la dynamique structurelle du génome et ses interactions avec le milieu. Si les outils numériques accélèrent l’analyse des données massives, ils ne captureront pas à eux seuls la nature vivante et récursive du système génétique. La recherche future devra donc combiner apprentissage machine, modélisation physique et validation expérimentale pour appréhender pleinement cette machine biologique adaptative. Loin d’être un programme automatique, le génome reste un orchestre contextuel dont la compréhension exigera encore longtemps l’expertise et l’intuition humaines.
