مجموعة بيانات توليد البروتين APM
التاريخ
منذ 11 أيام
الحجم
9.06 GB
رابط النشر
الترخيص
其他
الفئات
هذه المجموعة من البيانات هي مجموعة بيانات لتوليد البروتين، صدرت عام ٢٠٢٥ عن جامعة هونان، وجامعة الأكاديمية الصينية للعلوم، وفريق بايت دانس سيد. نتائج البحث ذات الصلة هي:نموذج توليدي شامل للذرات لتصميم مجمعات البروتين".
تكوين مجموعة البيانات
- مجموعة بيانات البروتين أحادي السلسلة: تحتوي على 187,494 عينة، تغطي مجموعة متنوعة من أنواع البروتين ووظائفه، من قواعد بيانات PDB (18,684)، وSwiss-Prot (140,769)، وAFDB (28,041).
- مجموعة بيانات بروتينات متعددة السلاسل: تحتوي على 11,620 عينة، تغطي مركبات بروتينية من 2 إلى 6 سلاسل، مما يدعم نمذجة السلاسل المتعددة. استُخلصت البيانات من بيانات التجميع البيولوجي لقاعدة بيانات البروتينات، باستثناء ثلاثة أنواع من العينات: العينات في قاعدة بيانات الأجسام المضادة SAbDab، والعينات التي تحتوي على سلاسل يقل طولها عن 30 سلسلة (تُعتبر ببتيدات)، والعينات التي يزيد طولها عن 2,048 سلسلة أو التي تفتقر إلى مُعرِّفات المجموعات. قام الباحثون بتعديل العينات متعددة السلاسل عشوائيًا أثناء التدريب: وُضعت العينات التي تحتوي على أكثر من 384 بقايا في مركز أزواج بقايا واجهة الارتباط بين السلاسل، مع الاحتفاظ بأقرب 384 حمضًا أمينيًا.
APM.torrent
البذر 1التنزيل 0مكتمل 0إجمالي التنزيلات 3