Command Palette
Search for a command to run...
مجموعة بيانات تسلسل بروتين UniRef50
التاريخ
عنوان URL للنشر
رابط الورقة البحثية
مجموعة بيانات تسلسل بروتين UniRef50 مأخوذة من قاعدة المعرفة UniProt، ونتائج الورقة ذات الصلة هي "AMix-1: مسار نحو نموذج أساس البروتين القابل للتطوير بمرور الوقت".
تحتوي مجموعة البيانات هذه، المُشتقة من UniProtKB والمُرشَّحة من تسلسلات UniParc عبر التجميع التكراري (UniProtKB+UniParc → UniRef100 → UniRef90 → UniRef50)، على 41,546,293 تسلسل تدريب و82,929 تسلسل تحقق. تضمن هذه العملية التكرارية تمثيلًا عالي الجودة، غير مُكرر، ومتنوعًا لتسلسلات UniRef50، مما يوفر تغطية شاملة لمساحة تسلسل البروتين لنماذج لغة البروتين.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.