مشاركة متعمقة من قبل رواد البحث في جامعة هونج كونج للعلوم والتكنولوجيا / مختبر الذكاء الاصطناعي في شنغهاي / جامعة شنغهاي جياوتونغ: أحدث الإنجازات، والخبرة في تقديم الأوراق إلى المؤتمرات الكبرى، وتحديات التعاون متعدد التخصصات...

يتكامل الذكاء الاصطناعي مع العديد من التخصصات مثل علوم الكمبيوتر والرياضيات والإحصاء والعلوم المعرفية، ويعتمد تطوره بشكل كبير على تنمية المواهب متعددة التخصصات. في السنوات الأخيرة، أدى صعود الذكاء الاصطناعي في مجال العلوم إلى جعل الجميع يرون الإمكانات الهائلة للتكامل العميق بين الذكاء الاصطناعي والتخصصات الأساسية. اليوم، يدفع العديد من العلماء البارزين البحث العلمي إلى آفاق جديدة بفضل خلفياتهم متعددة التخصصات. على سبيل المثال:
* يتمتع الأستاذ المشارك هوانغ هونغ من جامعة هواتشونغ للعلوم والتكنولوجيا بخبرة أكاديمية في هندسة البث والتلفزيون، وهندسة المعلومات، وعلوم الكمبيوتر.واليوم، تركز على البحث العلمي القائم على البيانات، بما في ذلك استخراج البيانات، وتحليل البيانات الضخمة، وتحليل الشبكات الاجتماعية، وما إلى ذلك.
* بدأ تشو دونغ تشان، الباحث الشاب في مركز الذكاء الاصطناعي للعلوم بمختبر الذكاء الاصطناعي في شنغهاي، مسيرته المهنية في مجال الفيزياء.اتجه إلى الذكاء الاصطناعي، ويعمل الآن على تطبيق الذكاء الاصطناعي في علوم المواد؛
* تشو بينجكسين، باحث مساعد في معهد العلوم الطبيعية بجامعة شنغهاي جياو تونغ،تخصصت في التمويل في دراستها الجامعية، وتحليل البيانات في دراسات الماجستير، وركزت على التعلم الآلي والتعلم العميق في دراسات الدكتوراه. وهي تستخدم الآن التعلم العميق لحل المشكلات في المجال البيولوجي، مثل تصميم البروتين وتعديله استنادًا إلى خوارزميات التعلم العميق.
هوانغ هونغ: يجب أن يكون بحثنا قادرًا على حل المشكلات العملية حقًا
بصفته أستاذًا مشاركًا ومشرفًا على الدكتوراه / الماجستير في جامعة هواتشونغ للعلوم والتكنولوجيا، شارك الأستاذ المشارك هوانغ هونغ بشكل عميق في مجالات استخراج البيانات وتحليل البيانات الضخمة لسنوات عديدة، ونشر العديد من الأوراق كمؤلف أول / مراسل في المجلات والمؤتمرات الدولية الكبرى مثل TKDE و TKDD و WWW و IJCAI و WSDM. لكن رحلتها في البحث العلمي لم تكن سهلة.

وفي معرض استذكارها لتجاربها المحبطة خلال دراستها العليا، قالت الأستاذة المشاركة هوانج هونج إنها قامت بمراجعة ورقة بحثية 28 مرة. عندما راجعته للمرة الخامسة والعشرين، شعرت بالإرهاق. وفي وقت لاحق، وبفضل تشجيع أصدقائها ومرشديها، هدأت من روعها، وأعادت النظر في الورقة، ووجدت أن هناك العديد من التفاصيل التي تحتاج إلى تحسين. وأخيرًا، ومن خلال التعديل والصقل المستمر، نجحت في نشره.
في رأي الأستاذ المشارك هوانغ هونغ، "إن مفتاح إجراء البحث العلمي هو معرفة ما إذا كانت فكرة مقالتك قادرة حقًا على حل مشكلة في جانب معين وما إذا كانت تطرح دافعًا بحثيًا معقولًا". وبناء على هذا المفهوم،تركز أبحاثها على اتجاهين: أولاً، ابتكار أساليب في تحليل البيانات الضخمة وتعدين البيانات؛ ثانياً، تطوير تطبيقات تعتمد على البيانات لحل المشاكل الاجتماعية العملية.
وفي مجال الابتكار المنهجي، يركز فريق الأستاذ المشارك هوانغ هونغ بشكل أساسي على الشبكات العصبية البيانية ونمذجة الأنظمة المعقدة. وتعتقد أنه في عصر البيانات الضخمة الحالي، ومن أجل استخراج قيمة البيانات بشكل أكثر فعالية، يمكن استخدام بنية الرسم البياني لتمثيل الأشياء من حولنا، أي نمذجة الأشياء بشكل تجريدي على شكل عقد، وتحليل العلاقات بين هذه العقد، ثم بناء بنية الرسم البياني.
بالإضافة إلى ذلك، يقوم فريقهم أيضًا بتطوير تطبيقات تعتمد على البيانات، مثل تحليل الشبكات الاجتماعية. في الفترة ما بين عامي 2009 و2012، بلغ تطور الشبكات الاجتماعية ذروته، مع ظهور منصات مثل ويبو وتويتر وفيسبوك تدريجيا. وقد دفع هذا أيضًا فريق الأستاذ المشارك هوانغ هونغ إلى استخدام البيانات من هذه المنصات لتحليل تطوير بنية الشبكة وإجراء توصيات المستخدمين وتحليل الرأي العام وغيرها من الأعمال.
قال الأستاذ المشارك هوانغ هونغ: "خلال جائحة كوفيد-19، قمنا بتحليل تعليقات وسائل الإعلام الإخبارية الدولية بشأن الصين ودرسنا التغيرات في مواقف الشبكات الأجنبية تجاه الصين، مما يوفر دعمًا للبيانات لفهم المواقف الخارجية".
ومن الدراسات المثيرة للاهتمام الأخرى تحليل الوضع الاجتماعي والاقتصادي للأفراد واستخدامه في التخطيط الحضري."نحن نعمل مع إدارة الاتصالات للحصول على بيانات سجل حركة الهاتف المحمول للمستخدمين، وتحديد مناطق نشاط المستخدمين من خلال تحليل مواقعهم عبر نظام تحديد المواقع العالمي (GPS)، ودمجها مع معلومات أسعار المساكن في هذه المناطق لاستنتاج مستوى المنطقة في المدينة." على سبيل المثال، إذا ظهر شخص ما بشكل متكرر في منطقة مالية، فقد يعني ذلك أنه يتمتع بمكانة اجتماعية واقتصادية عالية، بينما إذا ظهر بشكل متكرر بالقرب من المدارس أو المؤسسات التعليمية، فقد تكون هويته طالبًا أو معلمًا. وبناءً على ذلك، يمكن للباحثين تقييم الوضع الاجتماعي والاقتصادي للأفراد بشكل شامل وتوفير مرجع للتخطيط الحضري.
من حيث الذكاء الصناعي،ويستخدم فريق الأستاذ المشارك هوانغ هونغ أيضًا تقنية الذكاء الاصطناعي لتحديد وتشخيص الأعطال في المعدات الصناعية تلقائيًا، مما يحسن بشكل كبير من كفاءة ودقة صيانة المعدات.
واختتم الأستاذ المشارك هوانغ هونغ حديثه قائلاً: "يجب أن تكون مهتمًا بالبحث الذي تريد القيام به". في رأيها، البحث العلمي هو في الأساس عملية مملة وتتطلب قدرًا كبيرًا من الصبر، ولكن إذا كنت مهتمًا به حقًا، فسوف يكون لديك الدافع الذاتي للمثابرة. "هذه أيضًا هي الجودة التي أقدرها أكثر عند تجنيد الطلاب."
تشو دونغ تشان: دعونا ندع الذكاء الاصطناعي يولد أفكارًا جديدة مثل العلماء
ويتفق الدكتور تشو دونج جان أيضًا مع وجهة نظر الأستاذ المشارك هوانج هونج: "إذا لم يكن لديك أي اهتمام، فمن الصعب حقًا القيام بعمل أفضل". في رأيها، فإن النقطة الأساسية في اختيار اتجاه البحث ليست الحكم على ما إذا كان المجال "شائعًا" أو "شعبيًا". لا تزال المجالات الشائعة قادرة على إنتاج نتائج مثالية في الصناعة، كما يمكن للمسارات المتخصصة أيضًا اكتشاف بعض المشكلات الجديدة. يتعين علينا الخروج من منطقة الراحة الخاصة بنا، وتجنب الأبحاث المتجانسة، واختيار إنتاج بعض النتائج الأكثر صلابة.
في الوقت الحالي، يركز بحث الدكتور تشو دونجشان على تطبيق تقنيات الذكاء الاصطناعي مثل نماذج اللغة الكبيرة والنماذج متعددة الوسائط على علم المواد.وتظهر النتائج الرئيسية في الشكل أدناه:

في يناير الماضي،أطلق مختبر الذكاء الاصطناعي في شنغهاي نموذجًا لغويًا كبيرًا في مجال الكيمياء يسمى "Shusheng Jianyuan".استكشف الموضوعات المتطورة التي تجمع بين النماذج الكبيرة العامة والمجالات المهنية. يؤدي نموذج اللغة الكيميائية أداءً جيدًا في العديد من المهام الكيميائية الأساسية (المتعلقة بالجزيئات والتفاعلات)، وتتجاوز العديد من المؤشرات GPT-4. ونظراً لأهمية المعرفة الخارجية في البحث الكيميائي،أضاف الفريق آلية التوليد المعزز للاسترجاع (RAG) إلى نموذج اللغة.لتقليل مشاكل الهلوسة النموذجية. مع الأخذ في الاعتبار تنوع وسائل البيانات الكيميائية،كما قام الفريق بتطوير نموذج إصدار متعدد الوسائط.يؤدي هذا الإصدار من النموذج أداءً جيدًا في التعرف الجزيئي والتفكير الكيميائي المتعدد الوسائط، وتتجاوز العديد من المؤشرات GPT-4v. ونظرا لأهمية استخدام الأدوات العلمية للنماذج،قام الفريق بتطوير مجموعة أدوات العميل.دمج أكثر من 50 أداة كيميائية، تغطي البحث والحساب والجزيئات والتفاعلات، بحيث يمكن للنموذج أداء المهام ذات الصلة بكفاءة أكبر.
وبناءً على البحث المذكور أعلاه، يريد فريق المختبر أن يتولى الذكاء الاصطناعي مهام أكثر تعقيدًا، بدلاً من مجرد ترك نموذج اللغة الكبير على مستوى الإجابة على الأسئلة. وبدأ الفريق في استكشاف ما إذا كان الذكاء الاصطناعي قادرًا على توليد فرضيات بحثية علمية جديدة مثل العلماء.

كما هو موضح في الشكل أعلاه، يتم استخدام الذكاء الاصطناعي لتوليد فرضيات بحثية تلقائيًا استنادًا إلى الخلفية والمشاكل البحثية المحددة. على سبيل المثال، إذا كنت تريد دراسة نوع معين من البطاريات والبحث عن مواد ومكونات تلبي خصائص محددة، فيمكنك توليد أفكار علمية عالية الجودة ببساطة عن طريق فصل سياق البحث والإلهام والجمع بين نظام MOOSE-CHEM وعملياته المتعددة العوامل المدمجة.

توصلت الأبحاث إلى أن صياغة الفرضيات العلمية هي عملية تفكير معقدة يصعب توليدها مباشرة من خلال خطوة واحدة. لذلك، قام الفريق بتفكيك العملية، والبحث بشكل متكرر عن الإلهام والفرضيات، ومواصلة البحث في الفرضيات الناتجة لضمان أن تكون الفرضيات العلمية النهائية المتكونة أكثر صلابة وتنوعًا.
وفي الوقت نفسه، قام الفريق أيضًا ببناء فرضية علمية تم إنشاؤها بواسطة تقييم Benchmark. وكما هو موضح في الشكل أدناه، وجدت الدراسة أن النماذج ذات الأداء الأفضل تتمتع بقدرات استرجاع أقوى.

بالإضافة إلى ذلك، أكدت الدراسة أيضًا أنه في المهام المتعلقة بالكيمياء الكهربائية، يمكن للنموذج توليد فرضيات علمية قابلة للتنفيذ بدلاً من المفاهيم العامة فقط. على سبيل المثال، تشمل فرضياتها العلمية المكونات الأساسية للمادة، مثل الروثينيوم المعدني، وتطعيم النيتروجين، وما إلى ذلك في الوقت الحاضر،ويعمل فريق المختبر بالفعل مع مجموعات البحث ذات الصلة، على أمل تعزيز التطبيق العملي للنظام وجعله مساعدًا حقيقيًا للبحث العلمي.

إن السماح للذكاء الاصطناعي بتوليد أفكار البحث العلمي وحتى تعزيز الابتكار العلمي هو ما يعمل عليه فريق المختبر. عند استرجاع تجربته الأكاديمية، اعترف تشو دونغ تشان بأن موقفه من البحث العلمي كان متأثرًا بشكل كبير بالفيزيائي وو جيان شيونغ - "قد يأتي انحراف نتائج البحث من مشكلة تفصيلية صغيرة جدًا". ولذلك فهي تؤكد دائماً أن الاهتمام بالتفاصيل والتفكير العميق هما مفتاح تحقيق الإنجازات في البحث العلمي.
تشو بينج شين: نموذج البروتين الذي تم تطويره ذاتيًا يحتل المرتبة الأولى في القائمة العالمية الموثوقة
في مسار نمو كل شخص، قد يكون هناك "صنم" له تأثير خفي على الدراسة والمهنة وحتى التخطيط للحياة. وفي حديثها عن "مثلها الأعلى في البحث العلمي"، قالت الدكتورة تشو بينجكسين: "السبب الذي جعلني أختار إجراء البحث العلمي كان متأثرًا إلى حد كبير بمشرف الدكتوراه الخاص بي". في انطباع تشو بينج شين، فإن المشرف على أطروحتها للدكتوراه هو شخص مسؤول للغاية، جاد، صبور، سهل التعامل، ويرد على رسائل الطلاب في ثوانٍ. وكان يساعدها أيضًا في تعديل كلمة الرمز بكلمة والتحقق من اشتقاق الصيغة سطرًا بسطر. "آمل أن أتمكن في المستقبل من أن أكون مثل مرشدي وأعتبر تدريب الطلاب شيئًا مهمًا للغاية."
عندما يتعلق الأمر باختيار اتجاه البحث العلمي، يعتقد تشو بينغ شين أنه لا يوجد "مسار صحيح" واحد. المفتاح هو العثور على المسار الذي يناسبك بشكل أفضل والالتزام به. يعتمد الأمر على ما تفضل فعله ومدى تقبّلك للمخاطرة. ما دمت راضيًا، فلا داعي لاتباع الاتجاه بشكل أعمى.
كما شارك تشو بينجكسين أيضًا ببعض أبحاث الفريق في السنوات الأخيرة، وخاصة استكشاف الذكاء الاصطناعي في تعديل البروتين.
في الصناعة، يتم استخدام الإنزيمات في تطوير الأدوية ومراقبة الأمراض وتحلل البلاستيك، من بين تطبيقات أخرى. ومع ذلك، فإن البروتينات الطبيعية تأتي من الطبيعة ولها بيئة معيشية خاصة بها (مثل الضغط العالي ودرجة الحرارة العالية)، والتي قد لا تلبي الاحتياجات الصناعية. لذلك، فإنها تحتاج إلى تعديل لتحسين نشاطها التحفيزي، واستقرارها الحراري، وقدرتها على الارتباط، وانتقائيتها للركيزة.

في السنوات الأخيرة، ظهر تدريجياً تصميم البروتين بمساعدة الذكاء الاصطناعي.كما هو موضح في الشكل أدناه، وبعبارة بسيطة، يُسمح للنموذج الخاضع للإشراف الذاتي أولاً بتعلم كمية كبيرة من بيانات البروتين (التسلسل، والبنية، والمعلومات التطورية)، ثم يتم استخدام كمية صغيرة من مجموعات البيانات المسمىة المتعلقة بالمهام اللاحقة (التنبؤ بنشاط البروتين) لتدريب نموذج التنبؤ. وفقًا للاحتياجات المحددة (تحسين النشاط)، يتم إعادة تحسين بنية أو تسلسل البروتين أو تصميمه بالكامل.

بعد تعديل تسلسل البروتين، يمكن تحويله إلى أنظمة التعبير مثل الإشريكية القولونية والخميرة حتى يتمكن الفريق البيولوجي من التعبير عنه وتنقيته. يتم بعد ذلك اختبار البروتين المنقى لمعرفة خصائصه الكيميائية الحيوية، مثل النشاط والاستقرار وتقارب الارتباط، والتي تعتمد على التطبيق المحدد للبروتين. يمكن للخوارزميات أيضًا أن تقدم المساعدة في هذه العملية، مثل التنبؤ بالقدرة التعبيرية والذوبان ونشاط بروتين معين. وأخيرا، لا يلزم سوى استخدام تسلسل البروتين الموصى به بواسطة الخوارزمية في التجربة، وهو ما يمكن أن يوفر التكاليف بشكل أكبر.

كما هو موضح في الشكل أدناه،يركز عمل فريق تشو بينجكسين على وحدات مختلفة من هندسة البروتين، بما في ذلك على سبيل المثال لا الحصر استنتاج التسلسلات من بنية البروتين واستنتاج التسلسلات من الوظيفة."نأمل أن نتمكن من تطوير أدواتنا الخاصة واستكشاف كيفية الجمع بين هذه الأدوات والتجارب البيولوجية اللاحقة لتشكيل دورة كاملة، وبالتالي تحقيق التحسين التكراري بين التجارب الجافة (المحاكاة الحاسوبية) والتجارب الرطبة (التجارب البيولوجية الفعلية)."

حتى الآن، حققت الأدوات التي طورها الفريق نتائج ممتازة في التجارب الجافة والرطبة.على سبيل المثال، في القائمة العالمية الموثوقة ProteinGym، احتلت عارضات الشركة المركزين الأول والثاني على التوالي.

بالإضافة إلى ذلك، تم تطوير هرمون النمو من قبل الفريق،تم تحقيق أول إنتاج حقيقي على نطاق واسع في العالم (5000 لتر) من البروتين المصمم بالذكاء الاصطناعي.كما نجحوا في تعديل إنزيم EPS-G7، مما أدى إلى تحسين خصوصيته ونشاطه التحفيزي، وخفض تكاليف الإنتاج بنسبة 90%، وكسر قيود احتكار الاستيراد.

بالإضافة إلى تحويل نقطة واحدة أو عدد قليل من النقاط،كما قاموا أيضًا بإنشاء تسلسل البروتين الكامل بكامله.على سبيل المثال، يتم تعديل بروتينات سلسلة Ago (البقاء في درجات الحرارة العالية) المستخدمة في قص الأحماض النووية بحيث يمكنها الحفاظ على نشاط جيد في درجة حرارة الغرفة وتكون مناسبة لأعمال القص في مجموعات اختبار الأحماض النووية.

إن أكبر مشكلة بين ممارسي الذكاء الاصطناعي وممارسي العلوم هي التواصل
ومن الجدير بالذكر أنه نظرًا لأن مجال الدكتور تشو بينجكسين متعدد التخصصات للغاية، فمن أجل تعزيز التواصل بين ممارسي الذكاء الاصطناعي وممارسي العلوم، قام فريقهم بتجميع كمية كبيرة من البيانات والأدوات ووحدات اكتشاف المهام اللاحقة.وتم دمجه في مكتبة أدوات تسمى VenusFactory.

من وجهة نظر الدكتور تشو بينج شين، فإن مهارات التواصل لها أهمية حاسمة في التعاون بين الذكاء الاصطناعي والعلوم. عندما بدأتُ العملَ متعددَ التخصصات في علم الأحياء، رغبَ العديدُ من الشركاءِ البيولوجيين في العملِ معنا، لكنني لم أكن أفهمُ ما يقولون. الآن، بناءً على فهمي الخاص، أستطيعُ تحويلَ المشكلاتِ العلميةِ التي يطرحونها إلى مشكلاتٍ هندسية، وإيجادِ خوارزمياتٍ مناسبةٍ لحلِّها.
ويتفق الدكتور تشو دونغ تشان أيضًا مع هذا الرأي. وأكدت: "عند العمل مع الجامعات أو معاهد البحث أو الشركات، من الضروري ضمان فهم الطرفين للمشكلة على قدم المساواة. علينا أن نجعل شركائنا في المجال العلمي يدركون الوضع الحالي لتكنولوجيا الذكاء الاصطناعي، وأن نجعل الفريق الفني يفهم القضايا الأكثر أهمية".
وأضاف الأستاذ المشارك هوانغ هونغ أنه من المهم جدًا إتقان المعرفة الأساسية في التعاون بين التخصصات المتعددة. وتذكرت تعاونها مع فريق البروفيسور لوه جياد من قسم علم الاجتماع بجامعة تسينغهوا. في المراحل المبكرة، اقترح فريق علم الاجتماع أسئلة بحثية، وقدم الفريق الفني الدعم لتحليل البيانات وكان مسؤولاً عن التصميم التجريبي. مع مرور الوقت، تمكن الفريق الفني تدريجيا من إتقان المعرفة الأساسية لعلم الاجتماع، وبدأ في طرح الأسئلة بشكل مستقل ومناقشتها مع فريق علم الاجتماع. وقد أدى هذا التصادم بين الأفكار إلى ظهور العديد من نتائج الأبحاث.
ومن الجدير بالذكر أن مؤتمر ICLR 2025 والمؤتمرات الكبرى الأخرى أعلنت عن نتائجها مؤخرًا، وهناك أيضًا العديد من المؤتمرات المهمة التي لم تصل بعد إلى مواعيدها النهائية.كما اغتنمنا هذه الفرصة للسماح للمعلمين بمشاركة تجاربهم في تقديم أوراقهم البحثية إلى مؤتمرات الذكاء الاصطناعي الرائدة، كما هو موضح أدناه:
1. اقرأ دعوة تقديم الأوراق البحثية بعناية.توضيح متطلبات قبول المقالات في المؤتمرات الكبرى المختلفة لتجنب فقدان فرص التقديم.
2. انتبه إلى تفاصيل المقالة.يجب أن يكون التنسيق صحيحًا، والصور واضحة، والتخطيط جميلًا.
3. توضيح الموعد النهائي للتقديم.ينبغي إكمال جميع التجارب قبل أسبوع واحد على الأقل لضمان سلامة البحث وتقليل المساحة المتاحة للمراجعين للتساؤل.
4. أسئلة البحث،هل فكرة المقال تحل مشكلة معينة فعلا؟ ما إذا كان الدافع البحثي معقولاً.
5. نصائح حول كتابة الأوراق البحثية
* مخطط الورقة المقترح: أولاً، قم بتقديم الخلفية. ثانياً، ما هي الدراسات السابقة وما هي المشاكل الموجودة؟ ثالثا، ما هو عملنا؟ نحن نضمن أن يتم نقل فكرتك إلى المراجع وإقناعه بها.
* بالإضافة إلى ذلك، لضمان منطق المقالة، يجب ربط كل سؤال بحثي والتحقق التجريبي اللاحق معًا ومتسقًا مع نفسه.
6. حول الرفض:من الطبيعي أن يتم رفض مخطوطتك. لدى المراجعين تفضيلات مختلفة. يمكنك محاولة إرساله عدة مرات أخرى.