تصميم المعرفة: دفع حدود تصميم البروتينات من خلال تحسين المعرفة

أظهرت الدراسات الحديثة أداءً تنافسيًا في تصميم البروتينات، والذي يهدف إلى إيجاد التسلسل الأحماض الأمينية الذي يطوي إلى البنية المرغوبة. ومع ذلك، فإن معظم هذه الدراسات تتجاهل أهمية الثقة التنبؤية، ولا تغطي الفضاء البروتيني الواسع، ولا تدمج المعرفة الشائعة حول البروتينات. بعد ملاحظة النجاح الكبير للنماذج المُدرّبة مسبقًا في مهام متعددة مرتبطة بالبروتينات، بالإضافة إلى حقيقة أن الاسترداد مرتفع الارتباط بالثقة، نتساءل عما إذا كان يمكن لهذه المعرفة أن تدفع حدود تصميم البروتينات إلى أبعد من ذلك. كحل، نقترح وحدة واعية بالمعرفة تقوم بتحسين الأحماض الأمينية ذات الجودة المنخفضة. كما نقدم آلية استرجاع ذاكرة تقلل من وقت التدريب بأكثر من 50٪. قمنا بتقييم منهجنا بشكل مكثف على مجموعات بيانات CATH وTS50 وTS500، وتبين من نتائجنا أن منهجنا "Knowledge-Design" يتفوق على المنهج السابق PiFold بنسبة تقارب 9٪ على مجموعة بيانات CATH. وبشكل خاص، يُعد "Knowledge-Design" أول منهج يحقق نسبة استرداد تزيد عن 60٪ على معايير CATH وTS50 وTS500. كما نقدّم تحليلًا إضافيًا لتوضيح فعالية المنهج المقترح. وسيكون الكود متاحًا للجمهور قريبًا.