Command Palette
Search for a command to run...
منصة VenusFactory للتنبؤ بطفرة البروتين/التنبؤ بالوظيفة، منصة عمل هندسة البروتين، تتيح التطوير الكامل

يُعيد التحسن الملحوظ في كفاءة التصميم بالذكاء الاصطناعي صياغة نموذج البحث التقليدي في تصميم البروتينات. فمقارنةً بتجارب تصميم البروتينات التقليدية، لا تقتصر قدرة نماذج الذكاء الاصطناعي الكبيرة على التنبؤ بتسلسلات البروتينات وبنيتها ووظائفها وفحصها في وقت قياسي فحسب، بل يمكنها أيضًا تصميم بروتينات جديدة غير موجودة في الطبيعة بناءً على مبادئ فيزيائية وكيميائية وأنماط بيانات. بل إنها قادرة على التنبؤ في الوقت نفسه بخصائص البروتينات، مثل الاستقرار، وتقارب الارتباط، والحركية، من خلال نماذج التعلم متعدد المهام والتعلم العميق.
لكن،لقد أدى الإطار الحسابي المعقد للنموذج وقاعدة بيانات البروتين الضخمة إلى رفع عتبة استخدام أدوات الذكاء الاصطناعي.من ناحية، يتطلب اعتماد مجال تصميم البروتينات على البيانات البيولوجية من الباحثين استرجاع البيانات من قواعد بيانات متعددة وتنزيلها وتجميعها وتحويلها، مما يستغرق وقتًا طويلاً. من ناحية أخرى، لا تستطيع نماذج الذكاء الاصطناعي للبروتين حاليًا سوى حل مهام فردية في مجالات محددة، وتفتقر إلى نظام تقييم ذي بيانات مرجعية موثوقة.
بالإضافة إلى ذلك، فيما يتعلق بتحديات تصميم البروتين بالذكاء الاصطناعي، قدم الدكتور تان يانغ من مجموعة أبحاث البروفيسور هونغ ليانغ في جامعة شنغهاي جياو تونغ أيضًا أن نماذج الذكاء الاصطناعي الحالية في مجال تصميم البروتين لا تواجه صعوبة في الحصول على البيانات وتوحيد التنسيق فحسب، بل تواجه أيضًا صعوبة في ضبط المعلمات وبطء سرعة التدريب.لقد أعاقت العوائق الناجمة عن "حواجز البيانات، وحواجز النماذج، وحواجز التطبيق" نشر أدوات الذكاء الاصطناعي وتطبيقها في مجتمع بحثي علمي أوسع.
في الوقت نفسه، فيما يتعلق بالحلول الحالية، تُعد خوادم الويب بسيطة وسهلة الاستخدام، إلا أن وظائفها محدودة، ولا يمكن تدريبها بناءً على بيانات فردية، كما أن ذكائها محدود. يُقلل الوكلاء من التدخل البشري، ويمكنهم التركيز مباشرةً على أهداف النتائج، وإكمال وحدة عمل واحدة أو أكثر بشكل مستقل.
لتعزيز التطبيق الواسع النطاق للذكاء الاصطناعي في مجال هندسة البروتين،قامت مجموعة الأبحاث التابعة للبروفيسور هونغ ليانغ في جامعة شنغهاي جياو تونغ بتطوير منصة عمل مفتوحة المصدر للهندسة البروتينية، VenusFactory.تدمج المنصة استرجاع البيانات البيولوجية، ومعايرة المهام القياسية، ونماذج لغة البروتين المُدرَّبة مسبقًا (PLMs). تجمع المنصة بين وظيفتي خادم الويب والوكيل:
* تم تنفيذ التخصيص بدون كود لنماذج الذكاء الاصطناعي باستخدام مجموعات البيانات الخاصة، ودعم تنفيذ سطر الأوامر وواجهة بدون كود تعتمد على Gradio.
* يوفر تنزيلات مفتوحة المصدر لأكثر من 30 مجموعة بيانات معيارية كبيرة لتقييم النماذج، ويدمج أكثر من 40 مجموعة بيانات مرتبطة بالبروتين وأكثر من 40 من أدوات إدارة دورة حياة المنتج الشائعة، ويرتبط بسهولة ببيانات البروتين.
* يمكنه تحقيق التنبؤ بالطفرات بدون عينة، والجمع تلقائيًا بين نماذج الذكاء الاصطناعي للتوصية بالطفرات بناءً على الطلب، ودمج وحدات التنبؤ الخاضعة للإشراف للتنبؤ بالخصائص من خلال نماذج الذكاء الاصطناعي لتكامل الهدف.
في الوقت الحالي،منصة تصميم هندسة البروتين VenusFactory متاحة الآن في قسم البرامج التعليمية على الموقع الرسمي لشركة HyperAI (hyper.ai). يغطي البرنامج التعليمي لمنصة VenusFactory 7 وحدات وظيفية، ويمكنك تجربتها عبر الإنترنت من خلال النشر بنقرة واحدة:
* التدريب: تدريب النموذج بدون تعليمات برمجية، ويدعم أكثر من 40 نموذجًا كبيرًا، ويستخدم مجموعات بيانات خاصة لتدريب نماذجك الخاصة.
* التقييم: أداة سهلة الاستخدام لتقييم الأداء الشامل لنماذج البروتين.
* التنبؤ: استخدم النموذج المدرب للتنبؤ بوظيفة تسلسلات البروتين الجديدة.
* أدوات سريعة: إصدار سهل الاستخدام، يدعم التنبؤ بالطفرة بدون عينة (التطور الموجه) والتنبؤ الخاضع للإشراف (التنبؤ بالوظيفة أو الخاصية).
* أدوات متقدمة: إصدار مخصص متقدم، يدعم التنبؤ بالطفرة بدون عينة (التطور الموجه) والتنبؤ الخاضع للإشراف (التنبؤ بالوظيفة أو الخاصية).
* التنزيل: ربط بيانات البروتين بسهولة ودعم التنزيل متعدد الخيوط لقواعد البيانات الرئيسية الرئيسية (RCSB، UniProt...).
* VenusAgent: وكيل هندسة البروتين الذي يعمل مع DeepSeek لتمكين حساب البروتين بالذكاء الاصطناعي.
رابط البرنامج التعليمي:
بالإضافة إلى ذلك، قمنا بإعداد فوائد موارد الحوسبة المفاجئة للمستخدمين الجدد.قم بالتسجيل باستخدام رمز الدعوة "VenusFactory" للحصول على ساعتين من استخدام هاتف A6000 ثنائي الشريحة (فترة صلاحية الموارد هي شهر واحد).الكمية محدودة، لا تفوتها!
تشغيل تجريبي
١. أدخل عنوان URL hyper.ai في متصفحك. عند الوصول إلى الصفحة الرئيسية، انقر على صفحة البرامج التعليمية، ثم اختر منصة هندسة البروتين VenusFactory، ثم انقر على "تشغيل هذا البرنامج التعليمي عبر الإنترنت".


2. بعد الانتقال إلى الصفحة التالية، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك.

٣. اختر صورتي NVIDIA GeForce RTX 4090-2 وPyTorch، ثم انقر على "متابعة". توفر منصة OpenBayes أربعة خيارات دفع: الدفع حسب الاستخدام أو باقات يومية/أسبوعية/شهرية. يمكن للمستخدمين الجدد التسجيل باستخدام رابط الدعوة أدناه للحصول على ٤ ساعات مجانية من بطاقة RTX 4090 و٥ ساعات مجانية من استخدام المعالج!
رابط دعوة حصرية لـ HyperAI (انسخ وافتح في المتصفح):
https://openbayes.com/console/signup?r=Ada0322_NR0n


٤. انتظر حتى يتم تخصيص الموارد. تستغرق عملية الاستنساخ الأولى حوالي دقيقتين. عندما تتغير الحالة إلى "قيد التشغيل"، انقر على السهم بجوار "عنوان واجهة برمجة التطبيقات" للانتقال إلى صفحة العرض التوضيحي.نظرًا لأن النموذج كبير الحجم، يستغرق عرض واجهة WebUI حوالي 3 دقائق، وإلا فسيتم عرض "البوابة سيئة".يرجى ملاحظة أنه يجب على المستخدمين إكمال مصادقة الاسم الحقيقي قبل استخدام وظيفة الوصول إلى عنوان API.

عرض التأثير
فيما يلي صفحة استخدام VenusFactory. انقر على "دليل" لعرض أدلة استخدام وحدات التدريب، والتنبؤ، والتقييم، والتنزيل مباشرةً.

عرض وحدة التدريب
انقر على وحدة "التدريب" في وحدة "تدريب النموذج والتنبؤ":
* حدد نموذج لغة البروتين
* اختيار مجموعة البيانات
* معاينة مجموعة البيانات
* تكوين طريقة التدريب (راجع دليل المستخدم للحصول على معلومات محددة)
* تكوين الدفعة (راجع دليل المستخدم للحصول على التفاصيل)

قم بتعيين مسار حفظ نموذج التدريب وانقر فوق "بدء التدريب" لبدء التدريب.

في هذه المرحلة يمكنك رؤية معلمات التدريب ومنحنى الخسارة:

إذا كنت ترغب في استخدام مجموعة بياناتك الخاصة، يمكنك استخدام إعدادات مجموعة البيانات المخصصة. ما عليك سوى إدخال مسار مجموعة البيانات (راجع دليل المستخدم لمزيد من التفاصيل).
عرض وحدة التقييم
انقر على وحدة "التقييم" في وحدة "تدريب النموذج والتنبؤ".

تكوين الدفعة، انقر فوق "بدء التقييم" لبدء التدريب.

نتائج التقييم هي كما يلي، ويمكنك تنزيل ملف CSV:

إذا كنت ترغب في استخدام مجموعة بياناتك الخاصة، يمكنك استخدام إعدادات مجموعة البيانات المخصصة. ما عليك سوى إدخال مسار مجموعة البيانات (راجع دليل المستخدم لمزيد من التفاصيل).
عرض وحدة التنبؤ
انقر فوق وحدة "التنبؤ" في وحدة "تدريب النموذج وتدريب التنبؤ"، واضبط مسار حفظ نموذج التدريب، وحدد نموذج لغة البروتين، وانقر فوق "بدء التنبؤ" لبدء التدريب.
خذ التنبؤ بالتسلسل الفردي كمثال:

مثال على تسلسل البروتين: MKTWFGHVLQ

عرض فينوس إيجنت
انقر فوق وحدة VenusAgent.

بما أن VenusAgent يتطلب نماذج DeepSeek كبيرة الحجم، يوفر هذا البرنامج التعليمي طريقتي استدعاء: إدخال مفتاح واجهة برمجة التطبيقات بنفسك أو استخدام نموذج DeepSeek-R1-70B المُثبّت على المنصة. يمكنك اختيار تجارب بطاقات رسوميات مختلفة بناءً على الوظائف المطلوبة. تعليمات اختيار البطاقة هي كما يلي:
* إذا كنت تستخدم بطاقة رسوميات RTX 4090 واحدة، فإن وظيفة VenusAgent لا تدعم استخدام خدمات النماذج الكبيرة التي يتم نشرها محليًا (استخدام مفتاح API الخاص بـ DeepSeek غير محدود).
* إذا كنت تستخدم بطاقتي رسوميات RTX 4090، فلن تتمكن من استخدام وظائف أخرى فورًا (بعد 1-2 دقيقة) بعد استخدام وظيفة VenusAgent (لا يوجد قيد عند استخدام مفتاح API الخاص بـ DeepSeek).
* إذا كنت تستخدم بطاقتي رسوميات RTX A6000، فإن وظائف VenusAgent تكون غير محدودة.
* يمكن للمستخدمين إدخال مفتاح واجهة برمجة تطبيقات DeepSeek. إذا لم يكن الأمر كذلك، فسيتم استخدام خدمة النموذج الكبير المُنشَأة محليًا في البرنامج التعليمي افتراضيًا. عند استخدام خدمة النموذج الكبير المحلية، يستغرق وقت الاستجابة للمحادثة الأولى حوالي دقيقتين إلى ثلاث دقائق. يُرجى التحلي بالصبر.
ما ورد أعلاه هو برنامج تعليمي مفصل حول كيفية استخدام "منصة تصميم هندسة البروتين VenusFactory". الجميع مدعوون للحضور وتجربتها!
رابط البرنامج التعليمي:
احصل على أوراق بحثية عالية الجودة ومقالات تفسيرية متعمقة في مجال AI4S من عام 2023 إلى عام 2024 بنقرة واحدة⬇️
