HyperAI超神経

ProteinGym タンパク質変異データセット

日付

1年前

公開URL

github.com

カテゴリ

ダウンロードヘルプ

データセットには、87 回の DMS シーケンス実験から得られた合計約 150 万個のミスセンス バリアントが含まれています。

紙"少数ショット学習により最小限のウェットラボデータでタンパク質言語モデルの効率を向上「このデータセットをベンチマークテストデータセットとして使用した結果は、Nature のサブジャーナルである Nature Communications に掲載されました。