ProteinGym 蛋白质突变数据集

日期

5 个月前

发布地址

github.com

分类

下载帮助

数据集共包含来自 87 个 DMS 测序实验的大约 150 万个错义变体。

论文「Enhancing efficiency of protein language models with minimal wet-lab data through few-shot learning」使用该数据集作为基准测试数据集,该成果已发表在 Nature 子刊 Nature Communications