مجموعة بيانات طفرة البروتين في ProteinGym
تحتوي مجموعة البيانات على ما مجموعه حوالي 1.5 مليون متغير غير متماثل من 87 تجربة تسلسل DMS.
ورق"تعزيز كفاءة نماذج لغة البروتين باستخدام الحد الأدنى من بيانات المختبر الرطب من خلال التعلم من خلال عدد قليل من اللقطات"باستخدام مجموعة البيانات هذه كمجموعة بيانات مرجعية، تم نشر النتائج في Nature Communications، وهي شركة تابعة لـ Nature