HyperAI
il y a 4 jours

AlphaGenome : avancer dans la prédiction des effets des variants régulateurs avec un modèle de séquence d'ADN unifié

Žiga Avsec, Natasha Latysheva, Jun Cheng, Guido Novati, Kyle R. Taylor, Tom Ward, Clare Bycroft, Lauren Nicolaisen
AlphaGenome : avancer dans la prédiction des effets des variants régulateurs avec un modèle de séquence d'ADN unifié
Résumé

Les modèles d'apprentissage profond capables de prédire des mesures génomiques fonctionnelles à partir de la séquence d'ADN sont des outils puissants pour décrypter le code régulateur génétique. Les méthodes existantes font un compromis entre la longueur de la séquence d'entrée et la résolution des prédictions, ce qui limite leur champ d'application et leurs performances. Nous présentons AlphaGenome, une méthode qui prend en entrée 1 mégabase de séquence d'ADN et prédit des milliers de pistes génomiques fonctionnelles jusqu'à une résolution au niveau du pair de bases unique, couvrant diverses modalités – y compris l'expression des gènes, l'initiation de la transcription, l'accessibilité du chromatine, les modifications des histones, le binding des facteurs de transcription, les cartes de contacts du chromatine, l'utilisation des sites d'épissage et les coordonnées et la force des jonctions d'épissage. Formé sur les génomes humain et murin, AlphaGenome égale ou dépasse les meilleurs modèles externes disponibles dans 24 sur 26 évaluations concernant la prédiction des effets des variants. La capacité d'AlphaGenome à évaluer simultanément les effets des variants sur toutes les modalités reproduit avec précision les mécanismes des variants cliniquement pertinents près du gène oncogène TAL1. Pour faciliter son utilisation plus large, nous fournissons des outils permettant de faire des prédictions sur les pistes génomiques et les effets des variants à partir de la séquence.