HyperAI초신경

ProteinGym 단백질 돌연변이 데이터 세트

날짜

10달 전

발행 주소

github.com

카테고리

다운로드 도움말

이 데이터 세트에는 87개의 DMS 시퀀싱 실험에서 나온 총 약 150만 개의 미스센스 변형이 포함되어 있습니다.

종이"최소한의 습식 랩 데이터로 단백질 언어 모델의 효율성 향상(Few-Shot Learning)"이 데이터 세트를 벤치마크 데이터 세트로 사용하여 결과는 Nature의 자회사인 Nature Communications에 게재되었습니다.