ProteinGym タンパク質変異データセット
データセットには、87 回の DMS シーケンス実験から得られた合計約 150 万個のミスセンス バリアントが含まれています。
紙"少数ショット学習により最小限のウェットラボデータでタンパク質言語モデルの効率を向上「このデータセットをベンチマークテストデータセットとして使用した結果は、Nature のサブジャーナルである Nature Communications に掲載されました。
データセットには、87 回の DMS シーケンス実験から得られた合計約 150 万個のミスセンス バリアントが含まれています。
紙"少数ショット学習により最小限のウェットラボデータでタンパク質言語モデルの効率を向上「このデータセットをベンチマークテストデータセットとして使用した結果は、Nature のサブジャーナルである Nature Communications に掲載されました。