دورة تعليمية عبر الإنترنت | 150 أداة احترافية/59 قاعدة بيانات/105 حزمة، Biomni يتفوق على كفاءة الخبراء في 8 مهام بحثية حقيقية

يقع البحث الطبي الحيوي الحديث في تناقض "انفجار البيانات واختناق الكفاءة". فمن جهة، أدى تطور تقنيات مثل تسلسل الجينات وتحليل الخلية الواحدة إلى إنتاج بيانات ضخمة متعددة الوسائط - من تسلسلات القواعد الجينومية إلى بيانات التصوير السريري، ومن وفرة الميكروبيوم في الأنواع إلى خرائط الجزيئات الصغيرة للأيضات، وقد وصل حجم البيانات إلى مستوى PB؛ ومن جهة أخرى، أدى تجزئة عمليات البحث إلى تقييد سرعة الاكتشاف بشكل كبير: فقد يتطلب تحليل متعدد الأوميكس النموذجي استدعاء أكثر من عشر أدوات، والاستعلام عن عشرات قواعد البيانات، والرجوع إلى مئات الأوراق البحثية، وغالبًا ما تعتمد هذه المهام على الباحثين لإتمامها يدويًا، وهو أمر ليس فقط مُستهلكًا للوقت ولكنه أيضًا عُرضة للأخطاء.
ومع ذلك، فإن معظم أدوات الذكاء الاصطناعي الحالية "متخصصة"، مثل النماذج التي تركز على تصميم تجربة CRISPR أو التعليق التوضيحي على خلية واحدة.لا يمكنهم التعامل إلا مع مهمة واحدة ويواجهون صعوبة في التعاون عبر المجالات.عندما يتضمن البحث تقاطع علم الوراثة وعلم الأدوية، أو يتطلب دمج البيانات السريرية مع نتائج البحوث الأساسية، فإن هذه الأدوات لا تفي بالغرض. لذلك، أصبح بناء وكيل ذكي في مجال الطب الحيوي، قادر على التفكير باستقلالية واتخاذ قرارات مستقلة كالعلماء، مفتاحًا لحل معضلة البحث الحالية.
في هذا الصدد،قامت جامعة ستانفورد، بالتعاون مع شركة جينينتك، ومعهد آرك، وجامعة كاليفورنيا في سان فرانسيسكو ومؤسسات أخرى، بتطوير أول وكيل ذكاء اصطناعي عالمي للطب الحيوي، Biomni.يمكنه إجراء مجموعة واسعة من مهام البحث بشكل مستقل عبر مختلف المجالات الفرعية للطب الحيوي، وإنشاء أول وكيل بيئي موحد، مستخرجًا الأدوات وقواعد البيانات والحلول اللازمة من عشرات الآلاف من المنشورات في 25 مجالًا للطب الحيوي. بناءً على ذلك، يتميز Biomni ببنية وكيل عامة تجمع بين التفكير باستخدام نموذج اللغة الكبير (LLM) والتخطيط المُحسّن بالاسترجاع والتنفيذ القائم على الشيفرة البرمجية، مما يُمكّنه من بناء وتنفيذ سير عمل طبية حيوية معقدة بشكل ديناميكي دون الاعتماد على قوالب مُحددة مسبقًا أو عمليات مهام صارمة. تُظهر معايير النظام أن Biomni يحقق تعميمًا قويًا في المهام الطبية الحيوية غير المتجانسة دون أي ضبط فوري خاص بكل مهمة.
عنوان الورقة:
رابط البرنامج التعليمي للنشر بنقرة واحدة:
الهدف الأساسي من Biomni هو تطوير وكيل الذكاء الاصطناعي الطبي الحيوي العام الذي لا يتطلب قالبًا محددًا مسبقًا، بحيث يمكنه إكمال مهام البحث عبر المجالات بشكل مستقل.ويشمل ذلك على وجه التحديد ثلاثة جوانب من القدرات:
* اختراق القيود الخاصة بالمهمة:وتأمل شركة Biomni أن تتمكن من التعامل مع مجموعة متنوعة من المهام بدءًا من "تشخيص الأمراض النادرة" إلى "تحليل الاختلافات في الميكروبيوم" باستخدام تعليمات اللغة الطبيعية فقط.
* دمج القدرات المتعددة الوسائط:افتح العملية برمتها، من البيانات إلى التجارب. الحلقة المغلقة للبحث الطبي الحيوي هي "إدخال البيانات ← التحليل والاستدلال ← توليد الفرضيات ← تصميم التجارب ← التحقق من النتائج". يجب أن يغطي Biomni جميع مراحل العملية - فهو قادر على معالجة بيانات الأجهزة القابلة للارتداء بصيغة Excel وبيانات الخلية الواحدة بصيغة h5ad، وإنشاء شيفرة بايثون للتحليل، وتصميم تجارب تفاعل البوليميراز المتسلسل (PCR) للتحقق من الفرضيات.
* إنشاء نموذج جديد للتعاون بين الإنسان والآلة:لا يهدف Biomni إلى استبدال العلماء، بل إلى أن يصبح "مساعدًا خارقًا" - يكمل تلقائيًا المهام المتكررة مثل تنظيف البيانات واسترجاع الأدبيات، مما يسمح للباحثين بالتركيز على بناء الفرضيات والتصميم المبتكر.
مجموعة البيانات: مجموعة بيانات ثلاثية الطبقات لبناء قاعدة المعرفة الطبية الحيوية
تنبع قدرات بيومني القوية من تكاملها المنهجي لموارد البحث الطبي الحيوي. ومن خلال بناء مجموعة بيانات ثلاثية الطبقات، أنشأ الفريق "مختبرًا رقميًا" للذكاء الاصطناعي يشمل الأدوات والبيانات والمهام.
لتحديد الوحدات التشغيلية الأساسية للبحث الطبي الحيوي،قام الفريق باختيار 100 ورقة بحثية حديثة نُشرت في عام 2024 من كل فئة من فئات الموضوعات الـ 25 في bioRxiv (مثل علم الجينوم وعلم الأحياء الدقيقة وعلم الأدوية).من خلال "أداة اكتشاف الإجراءات"، تُحلل عملية البحث واحدةً تلو الأخرى، وتُستخرج أربعة عناصر أساسية: المهام، والأدوات، وحزم البرامج، وقواعد البيانات. تحتوي قاعدة البيانات على 59 موردًا أساسيًا، مُقسَّمة إلى فئتين: قواعد بيانات كبيرة يُمكن الوصول إليها عبر واجهة برمجة التطبيقات (API) (مثل قاعدة بيانات البروتين لتخزين هياكل البروتين، وقاعدة بيانات ClinVar للتباينات السريرية)، ومجموعات بيانات مُهيكلة مُوزَّعة محليًا (مثل إحصائيات ملخص دراسات الترابط واسعة النطاق (GWAS) وجينومات مرجعية للميكروبيوم).
ثانياً، للتحقق من القدرة على التعميم، قام الفريق ببناء مجموعة بيانات تقييم متعددة المستويات: معيار المعرفة العامة ومجموعة المهام في العالم الحقيقي.تتضمن معايير المعرفة العامة LAB-Bench (بما في ذلك الإجابة على أسئلة قاعدة بيانات DbQA واستدلال تسلسل SeqQA) واختبار Humanity's Last Exam (الذي يغطي 14 مجالًا فرعيًا في مجال الطب الحيوي).لا تعتمد مجموعات البيانات هذه على أدوات محددة، بل تُركز على دراسة قدرات الذكاء الاصطناعي الأساسية في التفكير. تتضمن مجموعة المهام العملية ثماني مهام متعددة المجالات، كل منها يُقابل سيناريو بحث فعلي.
ولإثبات قيمة التطبيق العملي،وقد اختار الفريق ثلاثة أنواع من البيانات النموذجية كبيانات دراسة الحالة:
* بيانات الأجهزة القابلة للارتداء: 458 ملف Excel من 30 مشاركًا، بما في ذلك مراقبة الجلوكوز المستمرة (CGM) وبيانات درجة الحرارة (تغطي ساعتين قبل الوجبات إلى 4 ساعات بعد الوجبات)، و227 ليلة من سجلات النوم (بما في ذلك مدة النوم، والكفاءة، والمرحلة، وما إلى ذلك)؛
* بيانات متعددة الأوميكس: مجموعة بيانات خلية واحدة لتطور الهيكل العظمي للجنين البشري (بيانات snRNA-seq و snATAC-seq لـ 336000 نواة)، بالإضافة إلى بيانات متعددة الأوميكس لـ 652 من الدهون، و 731 من المستقلبات، و 1470 بروتينًا؛
* بيانات التجارب الرطبة: 10 مهام استنساخ (تغطي Golden Gate وGibson وطرق أخرى)، بالإضافة إلى تجارب بناء ناقل CRISPR التي تستهدف جين B2M، والتي تم استخدامها للتحقق من الخطة التجريبية التي صممها Biomni.
هندسة النموذج: تصميم ثنائي المحرك وآلية تعاون ذكية
يتكون Biomni من عنصرين رئيسيين: Biomni-E1، وهي بيئة طبية حيوية أساسية ذات مساحة عمل موحدة، وBiomni-A1، وهو عامل مصمم للاستفادة بشكل فعال من هذه البيئة.
* Biomni-E1 ليس مجرد مجموعة أدوات، بل هو "مختبر رقمي" منظم، يجب أن يتوافق تصميمه مع المبادئ الثلاثة: الأصالة والمرونة وقابلية التوسع. أي أن جميع الأدوات والبرامج وقواعد البيانات يجب أن تخضع للتحقق من قِبل خبراء؛ ويتم نشر البرنامج في حاويات، ويدعم تبديل الإصدارات، وتدعم استعلامات قواعد البيانات إدخال اللغة الطبيعية؛ وتدعم الواجهات المحجوزة إضافة أدوات جديدة.
* Biomni-A1 هو "مركز صنع القرار" للذكاء العام. تتجاوز بنيته نموذج "المدخلات والمخرجات" للذكاء الاصطناعي التقليدي. يتميز بعملية حل للمشكلات مشابهة لتلك التي يستخدمها العلماء البشريون، ويجري اختيارًا ديناميكيًا للأدوات بناءً على التخطيط المُحسَّن بالاسترجاع. يستخدم الكود كواجهة عالمية، ويدعم المنطق المعقد مثل الحلقات والتوازي والأحكام الشرطية. كما يدعم التخطيط التكيفي، حيث تُولَّد الخطة الأولية بناءً على المعرفة، ويمكن تعديلها وفقًا للتغذية الراجعة أثناء التنفيذ.

الاستنتاج التجريبي: أداء ممتاز من اختبار المعايير إلى التحقق من المختبر الرطب
تم التحقق من أداء Biomni من خلال تجارب متعددة المستويات، ولم تُظهر نتائجها الاختراقات التكنولوجية فحسب، بل كشفت أيضًا عن القيمة العملية للذكاء الاصطناعي الطبي الحيوي العام.
في اختبارات المقارنة المعيارية، أظهرت Biomni مزايا كبيرة:
* في اختبار LAB-Bench،بلغت دقة الإجابة على أسئلة قاعدة البيانات (DbQA) 74.4%، وهو ما يضاهي الخبراء البشريين (74.7%) ويتجاوز بكثير وكيل الترميز (40.8%)؛ بلغت دقة الاستدلال التسلسلي (SeqQA) 81.9%، متجاوزة المستوى البشري (78.8%)، مما يشير إلى أن قدرتها على معالجة البيانات المنظمة والتسلسلات البيولوجية قريبة من قدرة الباحثين المحترفين.
* في اختبار HLE،تم تقييم 52 سؤالاً تغطي 14 مجالاً، بدقة 17.3%، أي ما يعادل 2.9 ضعف دقة اختبار ماجستير القانون الأساسي (6.0%) و1.3 ضعف دقة اختبار عامل الترميز (12.8%). تجدر الإشارة إلى أن HLE لا يتضمن ضبطًا لمجموعة التطوير، ويختبر قدرة التعميم على العينة الصفرية بشكل كامل. تُظهر النتائج قدرة Biomni على معالجة المشكلات غير المرئية بين المجالات.
بالإضافة إلى ذلك، في 8 مهام واقعية،يتجاوز متوسط أداء بيومني خط الأساس بكثير: أعلى بمقدار 402.3% من مستوى LLM الأساسي، وأعلى بمقدار 43.0% من عامل الترميز، وأعلى بمقدار 20.4% من المتغير الذي يستخدم فقط استدلال سلسلة ReAct (Biomni-ReAct). في مهمة التجزئة، بلغت دقة الكشف عن الجينات السببية في GWAS 68.3% (متوسط الخبراء البشريين هو 71.2%)، وبلغ معدل المطابقة الدلالية لتعليقات الخلية المفردة 89.7%، وبلغت درجة التوافق السريري لإعادة توزيع الدواء 0.78 (الدرجة الكاملة 1.0).

باختصار، يكسر Biomni قيود الذكاء الاصطناعي التقليدي في المجال الطبي الحيوي، المتمثلة في "أشخاص متخصصين لمناصب متخصصة"، ويحقق كامل عملية التشغيل الذاتي، بدءًا من تحليل شبكة تنظيم الجينات ووصولًا إلى تصميم التجارب الرطبة. هذا ليس ابتكارًا تقنيًا فحسب، بل هو أيضًا رؤية لمستقبل يعمل فيه علماء الأحياء الافتراضيون المدعومون بالذكاء الاصطناعي جنبًا إلى جنب مع العلماء البشريين، ويعززون قدراتهم.
في الوقت الحالي،تم إطلاق "Biomni: أول وكيل ذكي عالمي في مجال الطب الحيوي" على قسم "البرامج التعليمية" على الموقع الرسمي لشركة HyperAI (hyper.ai).يتيح لك النشر بنقرة واحدة تجربته عبر الإنترنت. ما عليك سوى إدخال تعليمات المهمة الطبية الحيوية لبدء عملية التحليل الآلي. انضم إلينا!رابط البرنامج التعليمي:
أعددنا أيضًا مزايا مفاجئة للمستخدمين الجدد. استخدم رمز الدعوة "Biomni" للتسجيل في منصة OpenBayes لتحصل على 5 ساعات مجانية من استخدام بطاقة RTX A6000 (البطاقة صالحة لمدة شهر). الكمية محدودة، والأولوية لمن يصل أولاً!
تشغيل تجريبي
1. بعد الدخول إلى الصفحة الرئيسية لـ hyper.ai، حدد صفحة "البرامج التعليمية"، وحدد "Biomni: The First Universal Biomedical Agent"، وانقر فوق "تشغيل هذا البرنامج التعليمي عبر الإنترنت".


2. بعد الانتقال إلى الصفحة التالية، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك.

٣. اختر "NVIDIA RTX A6000" و"vllm". توفر منصة OpenBayes أربع طرق دفع. يمكنك اختيار "الدفع الفوري" أو "يومي/أسبوعي/شهري" حسب احتياجاتك. انقر على "متابعة". يمكن للمستخدمين الجدد التسجيل باستخدام رابط الدعوة أدناه للحصول على ٤ ساعات من RTX 4090 + ٥ ساعات من وقت فراغ المعالج!
رابط دعوة حصرية لـ HyperAI (انسخ وافتح في المتصفح):
https://openbayes.com/console/signup?r=Ada0322_NR0n


٤. انتظر حتى يتم تخصيص الموارد. سيستغرق الاستنساخ الأول دقيقتين تقريبًا. عندما تتغير الحالة إلى "قيد التشغيل"، انقر على "فتح مساحة العمل" للانتقال إلى صفحة العرض التوضيحي.

٥. انقر نقرًا مزدوجًا على اسم المشروع في شريط المجلد الأيسر لبدء استخدامه. شغّل إلى "٣. تنفيذ المهام الطبية الحيوية باستخدام اللغة الطبيعية" وأدخل موجه الأوامر.

عرض التأثير
مثال على المطالبة: خطط لفحص CRISPR لتحديد الجينات التي تنظم استنفاد الخلايا التائية، وتوليد 32 جينًا تعمل على تعظيم تأثير الاضطراب.
التأثير هو كما يلي:


ما سبق هو البرنامج التعليمي المُوصى به من قِبل HyperAI. ندعو القراء المهتمين لتجربته ⬇️
رابط البرنامج التعليمي:
https://go.hyper.ai/Mox9F