Command Palette

Search for a command to run...

UniRef50 단백질 서열 데이터 세트

날짜

3달 전

발행 주소

www.uniprot.org

논문 URL

arxiv.org

Discord 커뮤니티 참여

UniRef50 단백질 서열 데이터 세트는 UniProt 지식 기반에서 가져온 것이며 관련 논문 결과는 다음과 같습니다.AMix-1: 테스트 시간 확장 가능 단백질 기반 모델로 가는 길".

UniProtKB에서 파생되고 UniParc 시퀀스에서 반복적 클러스터링(UniProtKB+UniParc → UniRef100 → UniRef90 → UniRef50)을 통해 필터링된 이 데이터셋은 41,546,293개의 훈련 시퀀스와 82,929개의 검증 시퀀스를 포함합니다. 이러한 반복적 과정을 통해 UniRef50 시퀀스의 고품질, 비중복성, 다양성을 보장하여 단백질 언어 모델에 대한 단백질 시퀀스 공간의 광범위한 커버리지를 제공합니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
UniRef50 단백질 서열 데이터 세트 | 데이터셋 | HyperAI초신경