HyperAI

مجموعة بيانات اختبار بنية الحمض النووي الريبوزي DRfold2

التاريخ

منذ 2 أشهر

المؤسسة

الجامعة الوطنية في سنغافورة

رابط النشر

zhanglab.comp.nus.edu.sg

مساعدة التنزيل

*تدعم مجموعة البيانات هذه الاستخدام عبر الإنترنت.انقر هنا للقفز.

تم إنشاء مجموعة بيانات DRfold2 بواسطة فريق البروفيسور Zhang Yang في الجامعة الوطنية في سنغافورة في عام 2025. عنوان الورقة البحثية ذات الصلة هو "من البداية التنبؤ ببنية الحمض النووي الريبي باستخدام نموذج اللغة المركبة والتعلم الشامل الخالي من الضوضاء". مجموعة البيانات عبارة عن مجموعة بيانات اختبار مستقلة تم إنشاؤها لتقييم أداء DRfold2 بشكل موضوعي في هذه الدراسة.

يحتوي على 28 بنية RNA بطول تسلسل أقل من 400 nts ومن الفئات الثلاث التالية:

  • أحدث تسلسلات أهداف ألغاز الحمض النووي الريبي
  • تسلسلات هدف الحمض النووي الريبي في مسابقة CASP15
  • أحدث هياكل الحمض النووي الريبي المنشورة في قاعدة بيانات بنك بيانات البروتين (PDB) اعتبارًا من 1 أغسطس 2024

ومن الجدير بالذكر أن الباحثين استبعدوا هياكل الحمض النووي الريبي الاصطناعي الكبيرة من مجموعة بيانات CASP15 لأنها تنحرف عن هياكل الحمض النووي الريبي الموجودة في الطبيعة، والتي تشكل التركيز الأساسي للتحليل الوظيفي وتصميم الأدوية.

ولضمان تقييم دقيق للنموذج، تحتوي مجموعة التدريب فقط على هياكل الحمض النووي الريبي المنشورة قبل عام 2024، وتستبعد الحمض النووي الريبي الذي يتشابه تسلسله مع مجموعة بيانات الاختبار بما يزيد عن 80%.