HyperAIHyperAI

Command Palette

Search for a command to run...

Rechercheurs : modèle de prédiction du splicing ARN

Une équipe de chercheurs de l'Institut de génome de Pékin, sous l'égide de l'Académie chinoise des sciences, a développé HELIX, un modèle de pointe pour prédire les régulations de l'épissage des transcrits d'ARN à l'échelle du transcrit. L'épissage constitue un mécanisme fondamental pour la production de multiples transcrits à partir d'un même gène, influençant directement leur séquence, leur structure et leur fonction. Bien que les technologies de séquençage à longue lecture permettent d'analyser la proportion relative des transcrits et d'identifier leurs spécificités selon les tissus, l'accès à ces données reste limité par la difficulté d'obtention des échantillons et le coût élevé du séquençage. De plus, les algorithmes existants se limitaient souvent à la prédiction de la force des sites d'épissage individuels sans pouvoir extrapoler aux niveaux d'expression des transcrits entiers ni s'adapter efficacement à de nouveaux tissus non étudiés. Le modèle HELIX comble ces lacunes en intégrant les séquences génomiques avec des matrices d'expression protéiques liant l'ARN spécifiques au tissu. Son architecture repose sur une stratégie de hiérarchisation de réseaux de profondeur profonde qui combine plusieurs étapes prédictives. D'abord, le système analyse la séquence d'ADN pour prédire les sites d'épissage et leur intensité de base. Ensuite, il incorpore les profils d'expression de 1499 protéines liant l'ARN, permettant une estimation précise du niveau de régulation de l'épissage pour un échantillon donné. Enfin, un réseau à mémoire à long et court terme, basé sur l'héritage d'insertion, décode les dépendances complexes entre les différents sites d'épissage. Les tests d'évaluation démontrent que HELIX surpassent les méthodes principales actuelles, en particulier pour les sites hautement régulés et la prédiction des proportions relatives de transcrits. L'application clinique de HELIX s'est révélée prometteuse lors de son utilisation sur une cohorte massive de patients atteints de cancer colorectal. Le modèle a permis d'identifier des dysrégulations de l'épissage et des anomalies d'expression des transcrits spécifiques aux cellules tumorales. Ces perturbations se sont avérées étroitement liées aux mutations génomiques, aux déséquilibres dans l'expression des protéines liant l'ARN et aux caractéristiques cliniques des patients. Ces résultats fournissent des marqueurs moléculaires essentiels pour mieux comprendre les mécanismes d'évolution tumorale et améliorer la stratification des patients. Pour aller plus loin dans la résolution de l'hétérogénéité au sein des tumeurs, les chercheurs ont également créé une version cellulaire unique du modèle, baptisée scHELIX. Cet outil permet de prédire les différences d'utilisation des transcrits au sein de différents types cellulaires et sous-groupes de tumeurs. Les analyses ont révélé des variations significatives de l'épissage et de l'expression des transcrits entre les sous-clones tumoraux, ouvrant de nouvelles perspectives pour l'étude de l'évolution du cancer et la découverte de nouvelles cibles thérapeutiques. Cette étude enrichit considérablement la compréhension des mécanismes d'épissage dépendants du tissu et liés à la maladie. Elle offre une méthodologie robuste pour la classification des cancers, l'interprétation des mutations pathogènes et la recherche en médecine de précision. Les résultats de cette recherche ont été publiés dans la revue Nature Computational Science, avec le soutien financier de la Commission nationale de la science naturelle et d'autres organismes.

Liens associés