HyperAI

مجموعة بيانات طفرة البروتين في ProteinGym

التاريخ

منذ 10 أشهر

رابط النشر

github.com

العلامات

مساعدة التنزيل

تحتوي مجموعة البيانات على ما مجموعه حوالي 1.5 مليون متغير غير متماثل من 87 تجربة تسلسل DMS.

ورق"تعزيز كفاءة نماذج لغة البروتين باستخدام الحد الأدنى من بيانات المختبر الرطب من خلال التعلم من خلال عدد قليل من اللقطات"باستخدام مجموعة البيانات هذه كمجموعة بيانات مرجعية، تم نشر النتائج في Nature Communications، وهي شركة تابعة لـ Nature