ProteinGym-Proteinmutationsdatensatz
Der Datensatz enthält insgesamt etwa 1,5 Millionen Missense-Varianten aus 87 DMS-Sequenzierungsexperimenten.
Papier"Verbesserung der Effizienz von Proteinsprachenmodellen mit minimalen Labordaten durch Few-Shot-Learning„Die Ergebnisse wurden in Nature Communications, einer Tochtergesellschaft von Nature Communications, veröffentlicht.