HyperAIHyperAI

Command Palette

Search for a command to run...

UniRef50-Proteinsequenzdatensatz

Datum

vor 3 Monaten

Veröffentlichungs-URL

www.uniprot.org

Paper-URL

arxiv.org

Treten Sie der Discord-Community bei

Der UniRef50-Proteinsequenzdatensatz stammt aus der UniProt-Wissensdatenbank und die zugehörigen Papierergebnisse sind „AMix-1: Ein Weg zum testzeitskalierbaren Protein-Grundlagenmodell".

Dieser Datensatz, abgeleitet von UniProtKB und gefiltert aus UniParc-Sequenzen durch iteratives Clustering (UniProtKB+UniParc → UniRef100 → UniRef90 → UniRef50), enthält 41.546.293 Trainingssequenzen und 82.929 Validierungssequenzen. Dieser iterative Prozess gewährleistet eine qualitativ hochwertige, redundante und vielfältige Darstellung der UniRef50-Sequenzen und bietet eine umfassende Abdeckung des Proteinsequenzraums für Proteinsprachenmodelle.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
UniRef50-Proteinsequenzdatensatz | Datensätze | HyperAI