ProteinGym 蛋白质突变数据集
数据集共包含来自 87 个 DMS 测序实验的大约 150 万个错义变体。
论文「Enhancing efficiency of protein language models with minimal wet-lab data through few-shot learning」使用该数据集作为基准测试数据集,该成果已发表在 Nature 子刊 Nature Communications
数据集共包含来自 87 个 DMS 测序实验的大约 150 万个错义变体。
论文「Enhancing efficiency of protein language models with minimal wet-lab data through few-shot learning」使用该数据集作为基准测试数据集,该成果已发表在 Nature 子刊 Nature Communications