3 天前
通过建模CRISPR–Cas序列设计高功能基因组编辑器
Jeffrey A. Ruffolo, Stephen Nayfach, Joseph Gallagher, Aadyot Bhatnagar, Joel Beazer, Riffat Hussain, et al

摘要
基因编辑在解决农业、生物技术和人类健康领域的根本性挑战方面具有巨大潜力。尽管源自微生物的基于CRISPR的基因编辑工具功能强大,但当其被移植到非天然环境(如人类细胞)时,往往表现出显著的功能权衡。人工智赋能设计提供了一种强有力的替代方案,有望突破进化限制,创造出具备最优性能的基因编辑工具。在此,我们利用大规模生物多样性数据训练的大型语言模型,成功实现了一种由人工智能设计的可编程基因编辑器对人类基因组的精准编辑。为达成这一目标,我们通过系统性挖掘26太字节的组装基因组与宏基因组数据,构建了一个包含超过100万个CRISPR操纵子的数据库。我们的模型展现出强大能力,生成的蛋白质簇数量达到自然界中CRISPR–Cas家族所含数量的4.8倍,并可针对Cas9样效应蛋白定制单导RNA序列。其中若干生成的基因编辑工具在活性和特异性方面与SpCas9——典型的基因编辑效应蛋白——相当甚至更优,同时其序列与SpCas9相差达400个突变。最后,我们证实,由人工智能生成的基因编辑器OpenCRISPR-1具备与碱基编辑兼容的潜力。我们已公开发布OpenCRISPR-1,旨在推动其在科研及商业应用中的广泛、合乎伦理的使用。