اقترح فريق AI4S بجامعة شنغهاي جياو تونغ مفهوم "المرافق العلمية الذكية" لإنشاء مساعد بحثي متعدد التخصصات في مجال الذكاء الاصطناعي

في السنوات الأخيرة، استمر تطبيق الذكاء الاصطناعي في البحث العلمي في التطور بشكل عميق، مع توسيع نطاق مجالات تطبيقه أيضًا، من طي البروتين إلى اكتشاف مواد جديدة، ومن التنبؤ بالأمراض إلى التشخيص والعلاج، ومن الاستكشاف الفلكي إلى تحليل الكوارث الطبيعية... وراء ازدهار الذكاء الاصطناعي للعلوم، من ناحية، أجرت شركات الذكاء الاصطناعي المحلية والأجنبية أبحاثًا وتطويرًا في مجال البحث العلمي، مما أدى إلى خفض عتبة استخدام أدوات الذكاء الاصطناعي؛ ومن ناحية أخرى، في عملية قبول "مساعدي الذكاء الاصطناعي"، قام الباحثون العلميون بتطوير نموذج تعاون فعال معهم.
يُظهر تحليل أجرته مجلة Nature أنه في قاعدة بيانات Scopus، ارتفعت نسبة الأوراق البحثية التي تذكر الذكاء الاصطناعي أو الكلمات الرئيسية المرتبطة بالذكاء الاصطناعي في العنوان أو الملخص من 2% قبل عشر سنوات إلى 8% الآن. ومع ذلك، بالنظر إلى النماذج الكبيرة والأدوات الأخرى التي أصدرتها شركات التكنولوجيا العملاقة ممثلة في Google DeepMind، فضلاً عن نتائج الأبحاث ذات الصلة التي نشرتها فرق البحث من الجامعات في الداخل والخارج، فإن معظمها يستهدف مشاكل محددة في مجالات محددة وتفتقر إلى القدرة على التكرار.
قال البروفيسور لين تشوتشن، من كلية الذكاء بجامعة بكين، في مقابلة مع HyperAI: "تفتقر أدوات الذكاء الاصطناعي الحالية إلى الاتساق. حتى لو ركزنا فقط على الرياضيات، فهناك بالفعل اختلافات كبيرة بين أدوات الذكاء الاصطناعي المُطوّرة لنظرية الأعداد والهندسة، ناهيك عن أدوات الذكاء الاصطناعي متعددة التخصصات. لم تُصبح أدوات الذكاء الاصطناعي بعدُ أساسًا أساسيًا كأجهزة الكمبيوتر الحالية، والتي يسهل الوصول إليها. تشمل لغات الكمبيوتر الحالية لغات C وJava وPython وغيرها، ومن الممكن تمامًا حل المشكلات في تخصصات متعددة مثل الرياضيات والفيزياء والكيمياء بناءً على أيٍّ منها، مما يعكس تنوعها. ومع ذلك، ليس هذا هو الحال مع أدوات الذكاء الاصطناعي. يكفي إلقاء نظرة على سلسلة Alpha من Google DeepMind لمعرفة ذلك."
وفي ضوء ذلك،اقترح البروفيسور يانغ شياوكانغ وآخرون من فريق الذكاء الاصطناعي للعلوم في معهد الذكاء الاصطناعي بجامعة شنغهاي جياو تونغ مفهومًا لبناء مرافق علمية ذكية.إنها تشكل وظائف مبتكرة مثل النماذج الكبيرة في المجالات العلمية، والمحاكاة التوليدية والعكس، والتجارب غير المأهولة الذكية المستقلة، والتعاون البحثي العلمي الموثوق به على نطاق واسع. وقد تم نشر نتائج البحوث ذات الصلة فينشرة الأكاديمية الصينية للعلوم".

عنوان الورقة:
http://www.bulletin.cas.cn/previewFile?id=52965146&type=pdf&lang=zh
تابع الحساب الرسمي وأجب بـ "AI4S" للحصول على الورقة كاملة
موازنة الابتكار والتمكين
اقترح فريق الذكاء الاصطناعي للعلوم بجامعة شنغهاي جياو تونغ أنه من أجل تحقيق الابتكار المصدر للعلوم الأساسية والابتكار التكنولوجي الرئيسي في العصر الذكي، هناك مشكلتان أساسيتان يجب حلهما بشكل عاجل:
*كيف يمكن بناء منشأة ذكاء علمي جديدة تعتمد على نموذج البحث في الذكاء الاصطناعي للعلوم؟
*كيف يمكن استخدام الجيل الجديد من الذكاء الاصطناعي لتمكين المرافق العلمية التقليدية؟

من حيث الابتكار،من الضروري إطلاق العنان بشكل منهجي وشامل لإبداع ومرونة الجيل الجديد من الذكاء الاصطناعي (وخاصة الذكاء الاصطناعي التوليدي والنماذج الكبيرة) في مجال العلوم الأساسية، وتحقيق وظائف مبتكرة مثل توليد الفرضيات التلقائية، واستنتاج القانون التلقائي، والتجارب غير المأهولة المستقلة، والتعاون الموثوق به ذاتيًا، وتعزيز الاستكشاف العلمي التكراري عالي السرعة وعلى نطاق واسع للغاية.
في ظل المرافق العلمية التقليدية ونماذج البحث،تواجه عملية البحث العلمي برمتها صعوبات مثل صعوبة توصيل القضايا العلمية، وصعوبة إجراء التجارب العلمية، وصعوبة مشاركة البيانات العلمية. وتظهر هذه الصعوبات بشكل خاص في بعض المرافق العلمية واسعة النطاق ذات التقنية العالية وبيئات البحث العلمي المعقدة للغاية فيها. إن استخدام الجيل الجديد من الذكاء الاصطناعي لتحقيق حلقة مغلقة فعالة من "المشاكل العلمية (العلماء) - المعدات التجريبية (المجربون) - بيانات البحث العلمي والأدبيات (مؤسسات البحث العلمي والوسطاء)" ليس فقط سمة قياسية للمرافق العلمية المبنية حديثًا، بل هو أيضًا طلب جديد وفرصة جديدة في عملية ترقية وتجديد المرافق العلمية القائمة.
لذلك، فإن فكرة الفريق لبناء "منشأة علمية مدعومة بالذكاء الاصطناعي" (AISF) تأخذ في الاعتبار جانبين: "إنشاء مرافق علمية جديدة شديدة الذكاء" و"تمكين المرافق العلمية الكبيرة الموجودة".

كما هو موضح في الشكل أعلاه، تشكل المرافق العلمية الذكية بنية ثلاثية الطبقات من المرافق العلمية الذكية مع وجود الأشخاص في الحلقة.
*طبقة دعم القاعدةمن خلال الحوسبة عالية الأداء وشبكة قوة الحوسبة، لتشكيل دعم قوة الحوسبة؛
*طبقة النموذج العلمي، بناء نماذج علمية متعددة التخصصات ومتعددة الوسائط و"مساعدي أبحاث الذكاء الاصطناعي"؛
* طبقة التطبيق التجريبيةمن خلال الروبوتات التي تعمل بالذكاء الاصطناعي والبيئات التجريبية الذكية، يمكن تحقيق تجارب غير مأهولة مستقلة والتعاون البحثي العلمي متعدد الأطراف.
4 ميزات مبتكرة
وبناءً على البنية ثلاثية الطبقات، يمكن للمرافق العلمية الذكية تشكيل أربع وظائف رئيسية جديدة لا يمتلكها النموذج التقليدي، وهي النماذج العلمية الكبيرة، والمحاكاة التوليدية والعكس، والتجارب غير المأهولة المستقلة عالية الإنتاجية، والتعاون البحثي العلمي الموثوق به على نطاق واسع.

النموذج العلمي
باعتباره "مساعدًا للذكاء الاصطناعي" لمساعدة العلماء البشريين في إجراء البحوث العلمية، يحتاج النموذج العلمي الكبير إلى أن يكون لديه خلفية معرفية متعددة التخصصات، وأن يكون قادرًا على معالجة بيانات الإدخال عبر الوسائط، وإتقان القدرة على استدعاء الأدوات العلمية الخارجية، والجمع بين ردود الفعل والتقييم لتحقيق التطور المستمر.

كما هو موضح في الشكل أعلاه، فإن بناء نموذج علمي كبير يتطلب تشكيل أربع قدرات متخصصة فوق نموذج اللغة الكبير الأساسي وبناء معايير التقييم المقابلة.
الأول هو القدرة على توحيد المدخلات عبر التخصصات والوسائل.تشتمل البيانات الناتجة عن البحث العلمي بشكل عام على بيانات متعددة الوسائط مثل الصيغ والرسوم البيانية والصيغ الجزيئية بالإضافة إلى البيانات النصية. إن كيفية تحقيق مدخلات موحدة لهذه البيانات متعددة الوسائط ومن ثم نمذجة المعرفة المهنية متعددة التخصصات بشكل مشترك هي مشكلة صعبة تحتاج إلى حل عاجل في إنشاء نموذج علمي كبير.
والثانية هي القدرة على الاستعانة بالأدوات العلمية الخارجية بشكل فعال.تواجه النماذج الكبيرة مشكلة إخراج محتوى يبدو معقولاً ولكنه في الواقع خاطئ. إن النهج التقني القابل للتطبيق لحل هذه المشكلة هو استخدام نماذج كبيرة كمحركات للتخطيط والاستدلال، وتحسين المصداقية والدقة من خلال استدعاء أنواع مختلفة من الأدوات العلمية الخارجية.
ثالثها هو قدرة النموذج على التغذية الراجعة والتطور المستمر.من ناحية أخرى، يمكن للنماذج العلمية الكبيرة الاستفادة من ردود الفعل عالية الجودة من الباحثين لتحسين المعرفة المهنية في المجال العلمي، وتعزيز القدرة على النمذجة واستنتاج المعرفة العلمية، وتحسين مستوى توليد المحتوى العلمي واستقراء الأدبيات والاستدلال. ومن ناحية أخرى، يمكنهم استخدام التغذية الراجعة التجريبية لتحسين قدرتهم بشكل مستمر على توليد الفرضيات العلمية وتحسين الخطط التجريبية.
الرابع هو الوهم (هلوسة) القدرة على الإزالة.تشير الهلوسة إلى الظاهرة التي يكون فيها المحتوى الذي تم إنشاؤه بواسطة النموذج غير متوافق مع الحقائق في العالم الحقيقي أو مدخلات المستخدم. إن كيفية فحص المعرفة المتخصصة بشكل فعال واستخدام الخبرة عالية الدقة في التعلم التعزيزي لتحقيق التكرار وتحديث النماذج الكبيرة هي طريقة مهمة للقضاء على الأوهام العلمية. بالإضافة إلى ذلك، فإن التحسين المستهدف والتكامل المبني على النموذج الأساسي لتحسين مصداقية ودقة النموذج في مجالات محددة يعد أيضًا طريقة مهمة لتصحيح الأوهام العلمية.
أخيرا،يختبر معيار التقييم للنماذج العلمية الكبرى قدرات فهم البيانات والنمذجة متعددة الوسائط ومتعددة التخصصات للنماذج العلمية الكبرى من ناحية؛ ومن ناحية أخرى، يقوم هذا البحث بتقييم ما إذا كانت النماذج العلمية الكبرى تتمتع بالقدرة على استخدام الأدوات العلمية لإكمال المهام المعقدة بدقة وقوة، وما إذا كانت لديها القدرة القوية على رفض توليد محتوى كاذب وضار.
المحاكاة التوليدية والعكس
إن استخدام أدوات المحاكاة والمحاكاة الحاسوبية لتحقيق الاستنتاج بين "النظرية والظاهرة" يعد أحد أهم النماذج في البحث العلمي. إن طرق المحاكاة التقليدية التي تعتمد على الحسابات العددية لها حدود وتحديات من حيث سرعة الحل ودقته في العديد من السيناريوهات الواقعية.

المحاكاة التوليدية وعكس مساحة المحاكاة
كما هو موضح في الشكل أعلاه، فإن الشبكة العصبية التوليدية هي البنية الأساسية.يمكن تحويل مشكلة الحل العددي للأنظمة المعقدة إلى مشكلة ملاءمة البيانات.تم إنشاء رسم خرائط فعال من مساحة الفرضية إلى مساحة المحاكاة لتسريع الحل. بالإضافة إلى ذلك، يمكن لتقنية العرض التوليدي أيضًا تحقيق توليد تمثيلات للظواهر العلمية من مساحة المحاكاة إلى مساحة الملاحظة، ثم تحقيق التعلم المغلق عبر المساحات الثلاثة "الفرضية - المحاكاة - الملاحظة" لدفع عكس القوانين.
نظام تجريبي ذكي مستقل بدون طيار
يهدف نظام التجارب الذكية غير المأهولة المستقل إلى الجمع بين الإنجازات التكنولوجية في مجالات الذكاء الاصطناعي والروبوتات مع التجارب العلمية، وتحسين كفاءة التجارب وإمكانية إعادة استخدامها من خلال العمليات التجريبية غير المأهولة والموحدة وواسعة النطاق.

من بينها، يتضمن سير المهام لمنصة التشغيل التجريبية غير المأهولة والنظام الذكي ثلاث خطوات بشكل أساسي:
*التحسين التلقائي للحلول
*تخطيط المهمة المستقلة
*عملية تجريبية بدون طيار
وفي الوقت نفسه، اعتمادًا على دقة التشغيل،يمكن تقسيم العمليات التجريبية غير المأهولة إلى مقياسين مكانيين: مجهري وكبير.عادةً ما تكون أغراض التجارب غير المأهولة على المستوى المجهري عبارة عن جزيئات صغيرة مثل الخلايا الحية والبروتينات، وغالبًا ما يتم استخدام منصات تجريبية ثابتة. إن القضية الأساسية تكمن في تحسين إنتاجية العمليات عالية الدقة. تركز العمليات التجريبية غير المأهولة على نطاق واسع على اكتمال العملية التجريبية، وذلك باستخدام الروبوتات المتنقلة المزودة بأذرع آلية للتحرك بشكل مستقل بين المعدات التجريبية لإكمال التجارب الآلية متعددة المهام ذات العملية الكاملة.
بالإضافة إلى ذلك، بناءً على منصة الأجهزة، فإن بناء برمجيات النظام الذكي هو قضية أساسية أخرى لمنصة التجارب غير المأهولة الذكية المستقلة. يتحكم البرنامج في عمليات إدراك الحالة الذاتية، وإدراك البيئة الخارجية، والملاحة المتنقلة، وتحديد موقع الأجهزة، وتخطيط العمليات التجريبية وتنفيذ التحكم. يمكن أن يؤدي التعلم التعزيزي العميق والتعلم المقلد إلى إجراء تعلم مستقل من خلال مسار تجربة التفاعل البيئي أو مسار التدريس الخبير، وبناء علاقة رسم خرائط بين معلومات الملاحظة والإجراءات المثلى.
التعاون البحثي العلمي واسع النطاق
تدعم المرافق العلمية الذكية تبادل البيانات لتسهيل تطوير واختبار نماذج الذكاء الاصطناعي، ولكن هناك حاجة إلى تصميم سلسلة من التدابير لتحديد وحماية حقوق الملكية الفكرية ومصالح مطوري البيانات. في السنوات الأخيرة، اجتذبت العلوم اللامركزية (DeSci) اهتمامًا كبيرًا من الباحثين. تهدف DeSci إلى استخدام أدوات Web3، بما في ذلك العقود الذكية والبلوكشين، لحل قضايا الملكية الفكرية في البحث العلمي وتعزيز تبادل البيانات العلمية وتداولها.
في هندسة المرافق العلمية الذكية التي اقترحها فريق البحث،توفر تقنية Blockchain الأساس لإنشاء بيئة تعاونية آمنة وموثوقة. يمكن لتكنولوجيا التعلم الفيدرالي حل مشكلة جزيرة البيانات في بيئة تعاونية لامركزية وضمان أمن البيانات وكفاءة البحث العلمي. يمكن لذكاء أسراب الإنترنت دمج وحدات بحثية علمية مختلفة في منصة موحدة لتحقيق تعاون بحثي علمي فعال على نطاق واسع.

ممارسة وتعزيز تطوير الذكاء الاصطناعي للعلوم
كمرحلة أولى لتنفيذ مفهوم المرافق العلمية الذكية، قامت جامعة شنغهاي جياو تونغ ببناء منصة البيانات العلمية المفتوحة للذكاء الاصطناعي للعلوم، والتي تتضمن أربع منصات فرعية: قاعدة قوة الحوسبة العلمية، والبيانات العلمية، والذكاء الاصطناعي، والتعاون العلمي. وبناءً على هذه المنصة، تم تطوير "نموذج ماغنوليا العلمي"، وتم إصدار الإصدارين 1.0 و2.0 في يوليو وديسمبر 2023 على التوالي، لتغطية الكيمياء والسوائل والقانون ومعايير التقييم عبر العلوم وغيرها من المجالات.
في،يتضمن "نموذج علوم ماغنوليا 2.0" الذي تم إصداره منذ فترة قصيرة "قانون المصدر المفتوح (BAI-Law-13B)" و"التركيب الكيميائي 2.0 (BAI-Chem 2.0)".
لقد خضع BAI-Law-13B لتدريب مسبق للمجال باستخدام كميات هائلة من البيانات الموثوقة من الإنترنت الصيني وأكواد المصدر المفتوح والوثائق القضائية والوثائق القانونية والكتب القانونية لتشكيل نموذج BAI-Law-13B-Base. وعلى هذا الأساس، تم دمج الإشراف والضبط الدقيق لسيناريوهات التطبيق القضائي مثل ذاكرة المعرفة القانونية وفهم المعرفة القانونية وتطبيق المعرفة القانونية لتشكيل نموذج BAI-Law-13B-SFT. ويذكر أنه في معيار التقييم الشامل القانوني للطرف الثالث منضدة القانون في الاختبار، تفوقت على جميع النماذج العامة الصينية مفتوحة المصدر والنماذج القانونية الصينية الكبيرة في الاختبار.
يمكن لبرنامج BAI-Chem 2.0 تحقيق تصميم جزيء دواء سريع وفعال، ويمكنه تصميم 30 جزيئًا شبيهًا بالدواء وعالي الألفة للهدف في الثانية؛ تم تحسين دقة عملية التخليق الرجعي ذات الخطوة الواحدة Top1 على مجموعة اختبار USPTO لمجموعة البيانات العامة بمقدار 15% مقارنة بأفضل ما هو موجود حاليًا في الأدبيات. بلغت قيمة التنبؤ بالعائد R² للبيانات التجريبية عالية الإنتاجية 0.88؛ وصلت دقة توصية المحفز إلى 93.7%. في الوقت الحاضر، نجح BAI-Chem 2.0 في ربط التحقق من التجارب الرطبة بشكل فعال، وتحقيق التحسين التجريبي عبر الإنترنت، وتحسين كفاءة التجارب الكيميائية بسرعة.
إن الاهتمام المبكر بالذكاء الاصطناعي من أجل العلوم وتأسيس فريق بحثي مماثل كافٍ لإظهار الأهمية التي توليها جامعة شنغهاي جياو تونغ لـ AI4S، وهو تطبيق متطور للذكاء الاصطناعي. وفي الوقت الحاضر، لم يكتف الفريق بإنتاج نتائج ذات صلة، بل واصل أيضًا التعاون مع الشركات ذات الصلة. ومن المعتقد أنه في المستقبل القريب، سيتم تحقيق التعاون متعدد التخصصات والمبني على المنصة في "مفهوم المنشأة العلمية الذكية" بشكل حقيقي.
مراجع:
1.https://news.sjtu.edu.cn/jdzh/20240124/193351.html
2.https://cloud.baidu.com/news/news_85aaa2be-241d-45c2-8aa1-3c8bbcfbd09b