HyperAI

مجموعة بيانات توليد البروتين APM

التاريخ

منذ 11 أيام

الحجم

9.06 GB

المؤسسة

الأكاديمية الصينية للعلوم

رابط النشر

zenodo.org

الترخيص

其他

هذه المجموعة من البيانات هي مجموعة بيانات لتوليد البروتين، صدرت عام ٢٠٢٥ عن جامعة هونان، وجامعة الأكاديمية الصينية للعلوم، وفريق بايت دانس سيد. نتائج البحث ذات الصلة هي:نموذج توليدي شامل للذرات لتصميم مجمعات البروتين".

تكوين مجموعة البيانات

  • مجموعة بيانات البروتين أحادي السلسلة: تحتوي على 187,494 عينة، تغطي مجموعة متنوعة من أنواع البروتين ووظائفه، من قواعد بيانات PDB (18,684)، وSwiss-Prot (140,769)، وAFDB (28,041).
  • مجموعة بيانات بروتينات متعددة السلاسل: تحتوي على 11,620 عينة، تغطي مركبات بروتينية من 2 إلى 6 سلاسل، مما يدعم نمذجة السلاسل المتعددة. استُخلصت البيانات من بيانات التجميع البيولوجي لقاعدة بيانات البروتينات، باستثناء ثلاثة أنواع من العينات: العينات في قاعدة بيانات الأجسام المضادة SAbDab، والعينات التي تحتوي على سلاسل يقل طولها عن 30 سلسلة (تُعتبر ببتيدات)، والعينات التي يزيد طولها عن 2,048 سلسلة أو التي تفتقر إلى مُعرِّفات المجموعات. قام الباحثون بتعديل العينات متعددة السلاسل عشوائيًا أثناء التدريب: وُضعت العينات التي تحتوي على أكثر من 384 بقايا في مركز أزواج بقايا واجهة الارتباط بين السلاسل، مع الاحتفاظ بأقرب 384 حمضًا أمينيًا.

APM.torrent
البذر 1التنزيل 0مكتمل 0إجمالي التنزيلات 3
  • APM/
    • README.md
      1.67 KB
    • README.txt
      3.34 KB
      • data/
        • APM.zip
          9.06 GB