مراجعة النشاط 丨جامعة شنغهاي جياو تونغ / جامعة تشجيانغ / جامعة تسينغهوا / أوبن بايز العديد من الخبراء، يغطون الرعاية الطبية / المعلومات الجغرافية / الأنظمة المعقدة الحضرية / النماذج الجديدة للبحث العلمي

لقد لفت "تفضيل" جائزة نوبل لهذا العام للذكاء الاصطناعي انتباه الجمهور مرة أخرى إلى الذكاء الاصطناعي في مجال العلوم. ويمكن القول أيضًا إنه حدث بارز، يشير إلى أن نموذجًا جديدًا للبحث العلمي أصبح اتجاهًا لا مفر منه. إذا نظرنا إلى تطور العلوم، من العلوم التجريبية إلى العلوم النظرية، ثم إلى العلوم الحاسوبية والعلوم المعتمدة على البيانات المكثفة، فسوف نجد أن كل تحول نموذجي ساهم إلى حد كبير في تعزيز تقدم الحضارة الإنسانية. طوال العملية التكرارية، لم يتغير الدور الأساسي للبيانات أبدًا.
والآن، في عصر الذكاء الاصطناعي للعلوم، أصبح من الممكن استكشاف قيمة البيانات بشكل أكبر.ما هي الابتكارات التي سيشهدها مجال البحث العلمي الأساسي؟ كيف يحتضن الباحثون في المجالات العمودية الذكاء الاصطناعي؟
في مواجهة اتجاه تطوير الذكاء الاصطناعي للعلوم، عملت HyperAI على تعزيز تطوير AI4S المحلي من خلال أشكال مختلفة مثل تفسير الإنجازات المتطورة، وإعداد التقارير عن المؤسسات النموذجية، واستضافة الأنشطة الأكاديمية، كما قامت ببناء منصة اتصال للباحثين العلميين المحليين. 2 نوفمبر،باعتبارها مجتمع إنتاج مشترك، عقدت HyperAI منتدى مفتوح المصدر للذكاء الاصطناعي من أجل العلوم خلال مؤتمر COSCon'24، وهو المؤتمر السنوي التاسع للمصدر المفتوح في الصين وكرنفال الذكرى السنوية العاشرة لجمعية المصدر المفتوح.
يشرفنا أن ندعو وانغ تشين هان، مؤسس ومدير تنفيذي لشركة OpenBayes Bayesian Computing، وتشي جين، باحث معين خصيصًا في كلية علوم الأرض بجامعة تشجيانغ، وشي ويدي، أستاذ مشارك دائم في جامعة شنغهاي جياو تونغ وعالم شاب في مختبر الذكاء الاصطناعي في شنغهاي، ودينغ جينغتاو، باحث ما بعد الدكتوراه في مركز العلوم الحضرية والحوسبة، قسم الهندسة الإلكترونية، جامعة تسينغهوا.
في هذا المنتدى، شارك أربعة محاضرين في نشر المعرفة العميقة، وتقديم الحالات، وتحليل الاتجاهات وغيرها من الجوانب حول مواضيع مثل الذكاء الاصطناعي الطبي (AI4Health)، والذكاء الاصطناعي للمعلومات الجغرافية (GeoAI)، ومنصة السحابة الذكية للبحث العلمي، وأنظمة المجمعات الحضرية التي تعتمد على الذكاء الاصطناعي.
ثم،وسنقوم بعد ذلك بإبلاغ النقاط الرئيسية لمشاركة كل محاضر في شكل سجلات نصية ومقاطع فيديو.ابقوا متابعين!
نموذج جديد للبحث العلمي مدفوعًا بالذكاء الاصطناعي: ترقية شاملة للأساليب الإحصائية بواسطة الذكاء الاصطناعي
OpenBayes Bayesian Computing هي شركة رائدة في تقديم خدمات الذكاء الاصطناعي في الصين. وفي إطار عملية تمكين الجامعات والمؤسسات البحثية المحلية الرائدة، تتمتع الصين أيضًا برؤى عميقة في تطوير الذكاء الاصطناعي للعلوم. فيما يتعلق بقيمة التعلم الآلي في تعزيز الأبحاث المتطورة،اقترح مؤسس الشركة والرئيس التنفيذي وانج تشين هان صيغة مبتكرة: نموذج بيانات المقياس X هيكل = إنجازات البحث العلمي في مجال الذكاء الاصطناعي - البحث التقليدي.
وهذا يعني أنه في عملية البحث العلمي، ومن خلال تطبيق البيانات واسعة النطاق على هياكل نموذجية فعالة، من الممكن تجاوز الأساليب التقليدية بشكل كبير في مواضيع البحث العملية في أي مجال صناعي. وهذا أحد الأسباب المهمة وراء نمو البحث العلمي المعتمد على الذكاء الاصطناعي بمعدل يتراوح بين 2 و5 مرات خلال العامين الماضيين.

وفي الوقت نفسه، أكد وانغ تشين هان أيضًا أنه إذا ظل هيكل النموذج دون تغيير وزادت كمية البيانات بشكل أعمى، فقد تحدث تأثيرات هامشية، مما يجعل من الصعب تحسين الأداء؛ وبالمثل، عندما يكون مقياس البيانات مؤكدًا، فإن معلمات النموذج لا تكون بالضرورة أكبر كلما كان ذلك أفضل.فقط عندما يتم زيادة مقياس البيانات ومقياس المعلمات بشكل متساوٍ، سينخفض معدل خطأ التنبؤ إلى مستوى أقل.
بالإضافة إلى ذلك، ركز على مقارنة الاختلافات بين أساليب البحث التقليدية وأساليب البحث في مجال الذكاء الاصطناعي. ومن بينها أن طرق البحث التقليدية تعتمد بشكل كبير على خصائص الباحثين أنفسهم وقدرتهم على تحديد المشكلات، وتستخدم فقط "بيانات صغيرة"، مما يثير الشكوك حول قدراتها على التعميم والتوسع.تتطلب طريقة البحث في مجال الذكاء الاصطناعي إدخال بيانات واسعة النطاق وعالية الجودة واستخدام التعلم الآلي لاستخراج الميزات، بحيث تظل نتائج البحث العلمي المنتجة فعالة في حل المشكلات الواقعية.
وأخيرًا، قدم وانج تشين هان أيضًا شرحًا لكيفية تمكين الحوسبة البايزية من OpenBayes للذكاء الاصطناعي في مجال العلوم——قم بتغليف عناصر بيانات البحث العلمي مثل مجموعات البيانات مفتوحة المصدر، ودروس الذكاء الاصطناعي/الحوسبة عالية الأداء، والنماذج مفتوحة المصدر/الخاصة، وما إلى ذلك في برنامج مجموعة.مساعدة الباحثين العلميين على تحقيق اتصال شامل في بناء النماذج، والتفكير النموذجي، والحوسبة البرمجية الصناعية، وما إلى ذلك.
GeoAI وتطبيقاته الجيولوجية متعددة التخصصات
في مجال علم المعلومات الجغرافية، أدى تطوير تقنيات المراقبة المجسمة في الهواء والفضاء والأرض وتحت الأرض إلى تعزيز انفجار البيانات، مما أدى إلى ظهور مفهوم البيانات الضخمة المكانية الزمنية. ومع ذلك، فإن البيانات الضخمة التي تولدها العمليات المكانية الزمنية بمقاييس مختلفة تشكل أيضًا تحديًا كبيرًا لاستخراج المعلومات.
وقال الدكتور تشي جين، الباحث في كلية علوم الأرض بجامعة تشجيانغ:يعد تحليل الانحدار للعلاقات الجغرافية موضوعًا ساخنًا في أبحاث النمذجة الجغرافية.إن تطوير أساليب جديدة لتحليل الانحدار المكاني وتحسين القدرة على تحليل العلاقات الجغرافية واستخراجها له قيمة نظرية مهمة وأهمية عملية لفهم العمليات الاجتماعية والظواهر الجغرافية.

وردًا على ذلك، قام الدكتور تشي جين وفريقه بدمج فكرة الترجيح المكاني مع نموذج الشبكة العصبية.تم اقتراح نموذج الانحدار المرجح للشبكة العصبية الجغرافية (GNNWR).تم توسيع طريقة الانحدار المكاني لتناسب وشرح العلاقات غير الخطية للعناصر الجيولوجية. في نفس الوقت،كما قام الفريق بتطوير مكتبة نموذجية مفتوحة المصدر تعتمد على PyTorch - نموذج الانحدار الذكي المكاني الزمني.وقد دعم نظام منهجيتها أكثر من 30 دراسة في الجغرافيا والجيولوجيا وعلم المحيطات والغلاف الجوي وغيرها من المجالات.
ومن حيث التطبيق، قدم أداء نموذج GNNWR في سيناريوهات مثل التنبؤ بأسعار المساكن الحضرية، وتحليل تلوث الهواء، ونمذجة البيئة الإيكولوجية البحرية:
* إقامة علاقات مكانية زمنية بين النقاط ذات العينات المتفرقة والنقط غير المعروفة على طول الساحل وحل الأوزان غير الثابتة مكانيًا زمنيًا للحصول على توزيع عالي الدقة مكانيًا زمنيًا للسيليكات المذابة (DSi) في المياه الساحلية؛
* يمكن لـ GNNWR وصف عدم الثبات المكاني في البيئات الحضرية بدقة، مما يتيح نمذجة الانحدار للعمليات الجغرافية الحضرية مثل أسعار المساكن؛
* باستخدام بيانات AOD المعالجة، وDEM، وبيانات عامل المناخ، وبيانات PM2.5 التي تم جمعها بواسطة المحطات الفرعية، لإنشاء علاقة الانحدار غير الثابتة المكانية وتقدير تركيز PM2.5؛
* دمج نظرية تفسير شابلي في GNNWR يمكّن من التنبؤ الدقيق وتفسير التمعدن الجيولوجي في البيئات المكانية المعقدة.
الهدف الأساسي للفريق: بناء نظام ذكاء اصطناعي طبي عام
كان شيه وي دي، الأستاذ المشارك الدائم في جامعة شنغهاي جياو تونغ والعالم الشاب في مختبر الذكاء الاصطناعي في شنغهاي، مشاركًا بشكل كبير في مجال الرؤية الحاسوبية. بعد عودته إلى الصين في عام 2022، كرّس نفسه لأبحاث الذكاء الاصطناعي الطبي. في هذا المنتدى،لقد شارك إنجازات الفريق من وجهات نظر متعددة بما في ذلك بناء مجموعة بيانات مفتوحة المصدر وتطوير النماذج.
وأوضح البروفيسور شيه ويي دي أن معظم المعرفة في الطب، وخاصة الطب المبني على الأدلة، مستمدة من الخبرة الإنسانية. إذا استطاع المبتدئ أن يستنفذ جميع الكتب الطبية، فإنه يستطيع على الأقل أن يصبح خبيراً طبياً من الناحية النظرية. لذلك،خلال عملية تدريب النموذج، نأمل أيضًا أن نحقن فيه كل المعرفة الطبية.

ومع ذلك، في المجال الطبي، تعتبر البيانات عالية الجودة نادرة نسبيًا بسبب قضايا الخصوصية.وبعد عودته إلى الصين، بدأ البروفيسور شيه ويدي وفريقه في بناء مجموعة بيانات طبية واسعة النطاق.خاصة:
* تم جمع 1.6 مليون زوج من التعليقات التوضيحية للصور على نطاق واسع من PubMed Central وإنشاء مجموعة بيانات PMC-OA؛
* تم إنشاء 227000 زوجًا من الأسئلة والأجوبة البصرية الطبية من PMC-OA لتشكيل PMC-VQA؛
* تم إنشاء مجموعة بيانات Rad3D من خلال جمع 53000 حالة و48000 زوجًا من التعليقات التوضيحية المتعددة للصور من أنواع Radiopaedia.
* PubMed Central (PMC) هي قاعدة بيانات مجانية كاملة النصوص تم إنشاؤها وصيانتها بواسطة المركز الوطني لمعلومات التكنولوجيا الحيوية في الولايات المتحدة، وهي متخصصة في المقالات العلمية المفتوحة في مجالات الطب الحيوي وعلوم الحياة.
* توفر Radiopaedia إمكانية الوصول عالية الجودة ومجانية إلى المعرفة في مجال الأشعة والتصوير الطبي وهي عبارة عن منصة تحريرية تعاونية مفتوحة حيث يمكن لأخصائيي الأشعة/الطلاب وغيرهم من المتخصصين في الرعاية الصحية المساهمة في الحالات والمقالات وأمثلة التصوير.
من حيث بناء النموذج،وقد قدم بشكل رئيسي نموذج اللغة الطبية المحددة أو نموذج اللغة البصرية الذي طوره الفريق.على سبيل المثال، PMC-LLaMA، والنموذج الطبي متعدد اللغات MMedLLaMA، ونماذج التجزئة العامة مثل SAT.
نهج النمذجة التوليدية المكانية الزمنية للأنظمة الحضرية المعقدة
يركز الدكتور جينغتاو دينغ من مركز العلوم الحضرية والبحوث الحاسوبية، قسم الهندسة الإلكترونية، جامعة تسينغهوا، على النمذجة التوليدية وتطبيق الأنظمة المعقدة المكانية الزمنية التي تعتمد على الذكاء الاصطناعي.ركز الدكتور جينغتاو دينغ على تقديم الذكاء الاصطناعي التوليدي المكاني الزمني لنمذجة الأنظمة الحضرية المعقدة.
وأوضح الدكتور دينغ جينغتاو أن الصعوبات الرئيسية التي نواجهها حاليًا في نمذجة الأنظمة الحضرية المعقدة تشمل هيمنة البيانات المكانية الزمنية متعددة الوسائط والأبعاد العالية؛ لا يمكن تجاهل الحجم الهائل للنظام والتفاعل بين عناصره المختلفة؛ إن توزيع البيانات لكل نظام مختلف جدًا، مما يجعل من المستحيل استخدام نموذج عالمي، وما إلى ذلك.

وردًا على ذلك، بدأ هو وفريقه في استكشاف الذكاء الاصطناعي التوليدي المكاني الزمني لنمذجة الأنظمة الحضرية المعقدة.تم اقتراح نموذج انتشار موجه بالمعرفة الفيزيائية لمحاكاة تدفق الحشود؛ تم اقتراح نموذج انتشار معزز بديناميكيات الشبكة للتنبؤ بمرونة النظام؛ وتم اقتراح GPT مكاني زمني معزز بالتعلم السريع للتنبؤ المكاني الزمني العام.
خاصة:
* حقق نموذج محاكاة تدفق المشاة SPDiff تحسنًا في الأداء بنسبة 6.5%-37.2 استنادًا إلى مجموعة بيانات تدفق المشاة الحقيقية، بالإضافة إلى قدرة تعميم أفضل تحت أحجام عينات صغيرة؛
* نموذج التنبؤ بمرونة النظام يولد عينات مراقبة للأنظمة المرنة/غير المرنة بناءً على نموذج الانتشار، باستخدام 20 عينة مُسمّاة فقط (2%) والحفاظ على دقة التنبؤ 87% (درجة F1)؛
* يجمع نموذج التنبؤ الزماني المكاني العالمي UniST أكثر من 20 مجموعة بيانات زمانية مكانية وأكثر من 130 مليون نقطة عينة زمانية مكانية. ويستخدم شبكة ذاكرة مكانية زمنية خارجية لتخزين الأنماط المكانية الزمنية الصالحة وإنشاء متجهات سريعة لتحقيق تعميم الهجرة.
الكلمات الأخيرة
باعتبارها واحدة من أوائل مجتمعات المصدر المفتوح التي اهتمت بتطوير الذكاء الاصطناعي للعلوم، ستواصل HyperAI الاهتمام بالإنجازات المبتكرة المتطورة في الداخل والخارج، وتزويد الجميع بالتفسيرات والتقارير العملية. وفي الوقت نفسه، نعمل أيضًا على بناء منصة للتواصل والتبادل للباحثين من خلال مجموعة متنوعة من البث المباشر عبر الإنترنت والمنتديات الأكاديمية غير المتصلة بالإنترنت. نرحب بمجموعات البحث العاملة في مجال البحوث ذات الصلة لتقديم مقالات لنا أو مشاركة أحدث نتائج أبحاثهم!
