HyperAIHyperAI

Command Palette

Search for a command to run...

Une IA révolutionne la biologie cellulaire en décryptant les signaux cachés dans les données multimodales

L’étude des cellules, notamment dans le contexte du cancer, repose sur l’analyse de divers paramètres biologiques tels que l’expression génique, la protéomique ou la morphologie chromosomique. Chaque méthode de mesure fournit une perspective partielle sur l’état cellulaire, mais aucune n’offre une vision complète à elle seule. Les scientifiques sont ainsi confrontés à un défi majeur : intégrer de manière cohérente des données issues de multiples modalités tout en préservant l’origine spécifique de chaque information. Pour surmonter cette limitation, des chercheurs du Broad Institute du MIT et Harvard, en collaboration avec ETH Zurich et le Paul Scherrer Institute (PSI), ont développé un cadre d’intelligence artificielle capable de distinguer clairement les données partagées entre différentes modalités de mesure et celles propres à une seule technique. Contrairement aux méthodes traditionnelles d’analyse multimodale, qui regroupent toutes les informations dans une représentation unique, ce nouvel outil utilise une architecture de machine learning innovante. Il repose sur un espace de représentation partagée pour les éléments communs à plusieurs modalités (comme l’expression de gènes et l’accessibilité chromatinienne), ainsi que des espaces dédiés pour les caractéristiques spécifiques à une seule méthode. Cette approche, inspirée d’un diagramme de Venn, permet de cartographier précisément d’où provient chaque information au sein de la cellule. Le modèle, conçu par Xinyi Zhang, ancien doctorant au MIT et désormais chef de groupe à AITHYRA à Vienne, et dirigé par Caroline Uhler (MIT) et G.V. Shivashankar (ETH Zurich/PSI), repose sur une procédure d’apprentissage en deux étapes qui améliore sa capacité à gérer la complexité des interactions cellulaires. Testé sur des jeux de données synthétiques et réels, le cadre a correctement identifié les informations partagées entre transcriptomique et accessibilité chromatinienne, tout en isolant les données uniques à chaque modalité. Il a également permis d’identifier avec précision la source d’un marqueur protéique lié aux dommages de l’ADN dans les cellules cancéreuses — une information cruciale pour les cliniciens souhaitant choisir la méthode de mesure la plus adaptée. Cette capacité à décortiquer les données selon leur origine ouvre la voie à une compréhension plus fine des mécanismes sous-jacents aux maladies comme le cancer, les maladies neurodégénératives ou le diabète. Comme le souligne Caroline Uhler, « il ne suffit pas d’intégrer les données, il faut aussi les comparer pour comprendre comment les différents composants cellulaire interagissent ». L’objectif futur est d’améliorer l’interprétabilité du modèle et de l’appliquer à des questions cliniques plus larges. Financé par des organismes comme le NIH, la Fondation nationale suisse, AstraZeneca et le MIT-IBM Watson AI Lab, ce travail marque une avancée significative dans l’analyse cellulaire, offrant aux biologistes un outil puissant pour voir « le tableau global » au-delà des mesures isolées.

Liens associés

Une IA révolutionne la biologie cellulaire en décryptant les signaux cachés dans les données multimodales | Articles tendance | HyperAI