HyperAI

من نموذج القلب الكامل إلى تحليل شبكة الأمراض القائمة على درجة الماجستير في القانون، يقوم لي دونج من مستشفى تسينغهوا تشانج جونج بتحليل اتجاه تطوير النماذج الطبية الكبيرة من منظور البيانات

特色图像

مع استمرار تطور تكنولوجيا الذكاء الاصطناعي، أحدث الذكاء الاصطناعي تغييرًا جذريًا في المجال الطبي، إذ وفّر حلولًا جديدة لتحسين الكفاءة ودقة التشخيص في القطاع الطبي، من خلال دمج البيانات متعددة المصادر والخوارزميات الذكية. وتلعب البيانات الطبية دورًا حيويًا، باعتبارها "المحرك" للنماذج الكبيرة والناقل الأساسي لاتخاذ القرارات الطبية.وخاصة في سياق التحول الرقمي المتسارع للنظام الطبي في الصين، فإن تحليل النماذج الطبية من منظور البيانات يعد طريقا لا مفر منه نحو الابتكار.

في الآونة الأخيرة، في مؤتمر بكين تشي يوان 2025، تحدث البروفيسور لي دونغ، مدير مركز علوم البيانات الطبية في مستشفى تسينغهوا تشانج جونج، في منتدى "الذكاء الاصطناعي + العلوم والهندسة والطب".الموضوع هو "كيفية استخدام البيانات الطبية لإجراء أبحاث مبتكرة في عصر الرعاية الصحية الذكية".بالإضافة إلى الخبرة العملية لمستشفى تسينغهوا تشانج جونج التذكاري،ومن منظور البيانات، تمت مشاركة أبعاد متعددة بما في ذلك نموذج تنفيذ النموذج الكبير، والقيود الفنية، وإعادة بناء الموارد، واستكشاف التطبيقات.

كلمة البروفيسور لي دونغ

قامت شركة HyperAI بجمع وتلخيص مداخلة البروفيسور لي دونغ المُعمّقة دون المساس بالهدف الأصلي. وفيما يلي نصّ الكلمة.

تطبيقات وتحديات النماذج الكبيرة في السيناريوهات الطبية

تطبيق وضع "النشر المحلي + التطوير المخصص + الاستخدام دون اتصال بالإنترنت"

DeepSeek نموذجٌ ضخمٌ اكتسب شعبيةً واسعةً في السنوات الأخيرة. له ثلاثة أوضاع استخدام رئيسية في المجال الطبي: وضع الاستخدام الخفيف على الهواتف المحمولة، ووضع الوصول السحابي، و"النشر المحلي + التطوير المُخصّص + الاستخدام دون اتصال".

ومن بين طرق الوصول الثلاثة هذه،"النشر المحلي + التطوير المخصص + الاستخدام دون اتصال بالإنترنت" أصبح الحل الأمثل في الممارسة العملية.بسبب تقييد سياسة "عدم السماح للبيانات بمغادرة المستشفى"، لا يستطيع نموذج السحابة استخدام بيانات حقيقية لتدريبه، مما يجعله "نموذجًا ثابتًا"؛ كما أن تطبيق الهاتف المحمول خفيف الوزن لا يُغطي سوى الاستشارات البسيطة، ولا يُلبي الاحتياجات الطبية الأساسية. على الرغم من أن "النشر المحلي + التطوير المُخصص + الاستخدام دون اتصال" يُمكن أن يُجنّب تسرب البيانات ومخاطر التلوث (مثل خلط بيانات الهلوسة الخارجية)، إلا أن هذا يعني أيضًا أن المستشفى سيضطر إلى تحمل تكاليف طاقة الحوسبة العالية بشكل مستقل.

تحديات النماذج الكبيرة في الرعاية الصحية

هناك العديد من التحديات في عملية تنفيذ النموذج الكبير في المستشفى.على سبيل المثال، العيوب الخوارزمية، ومشاكل الهلوسة، وفخاخ القوة الحاسوبية، وعدالة الذكاء الاصطناعي، وما إلى ذلك.

* عيوب الخوارزمية:يعود سبب شعبية DeepSeek الكبيرة إلى كونه مفتوح المصدر وسعره المنخفض. يُقلل "وضع الخبراء المختلط" (MoE) الذي يعتمد عليه من قدرة الحوسبة القصوى من خلال تقسيم الشبكة العصبية، إلا أنه يُظهر بعض القيود في الحالات الطبية: أولاً، لا يدعم الاستشارة متعددة الوسائط، كما أن "اتخاذ القرارات من قِبل خبير واحد" يُعرّض التشخيصات الخاطئة عند مواجهة الحالات المعقدة؛ ثانياً، للحفاظ على قوة الحوسبة، سيتم نشر البيانات عشوائياً عبر الإنترنت، مما قد يؤدي إلى فقدان معلومات أساسية (مثل تاريخ الحساسية والتاريخ الجراحي)، ويُهدد التشخيص والعلاج.

سير عمل وضع وزارة التعليم

* مشاكل الهلوسة:يبلغ الحد الأقصى لمعدل الهلوسة في الإصدار الحالي من DeepSeek 50%. ورغم أنه من المتوقع أن ينخفض معدل الهلوسة في الإصدار الجديد إلى أقل من 20%، إلا أننا ما زلنا بحاجة إلى توخي الحذر في الحالات الطبية. نستخدم "آلية التحقق الثلاثية" (الفحص الأولي للخوارزمية + مراجعة الطبيب + مقارنة قاعدة المعرفة) لتقليل المخاطر، إلا أنها تزيد من تكلفة التشخيص والعلاج.

* فخ قوة التجزئة:إن استهلاك الطاقة في مراكز الحوسبة الصغيرة مذهل بالفعل، ويتطلب تدريب النماذج الطبية الكبيرة الأكثر تعقيدًا استثمارًا مستمرًا.

* عدالة الذكاء الاصطناعي:تحتكر المستشفيات الرائدة النماذج المتقدمة من خلال الاستفادة من مزايا الموارد التي تتمتع بها، وهو ما قد يؤدي إلى تفاقم "الفجوة الرقمية".

إعادة بناء معايير التقييم الطبي: من "المعيار الثلاثي المستويات" إلى "المنافسة السداسية العوامل"

إن استخدام نماذج ضخمة في المجال الطبي أكثر تعقيدًا مما كان متوقعًا. كانت اللجنة الوطنية للصحة تأمل في البداية في تخفيف اختلال التوازن في الموارد الطبية من خلال الذكاء الاصطناعي، ولكن بعد ثلاثة أشهر من استخدامنا له، وجدنا أن النتائج كانت عكسية.  وبعيداً عن تحسين اختلال التوازن في الموارد الطبية، فإن النموذج الكبير يعمل على إعادة تشكيل المشهد التنافسي للمستشفيات الجامعية.

معايير التقييم للمستشفيات الجامعية التقليدية هي "الأطباء المشهورين، والمعدات، وبيئة الأجهزة"، ولكن في عصر النماذج الكبيرة، تمت إضافة ثلاثة عتبات جديدة:

الأول هو قوة الحوسبة القوية.كان مستشفى تشانغ غونغ التذكاري يتمتع في السابق بثاني أكبر سعة حاسوبية بين المؤسسات الطبية في بكين، إلا أنه ظل عاجزًا عن دعم التدريب طويل الأمد. حتى أنه عند افتتاح مركز حاسوبي صغير، كان من الممكن أن يتسبب ذلك في انقطاع التيار الكهربائي عن نصف المبنى.

والثاني هو مهندس حوكمة بيانات من الدرجة الأولى.تتضمن البيانات الطبية السجلات الطبية الإلكترونية والصور والفحوصات وأنواعًا أخرى، والتي تحتاج إلى تنظيف وتصنيف وهيكلة. استثمرنا 5 ملايين دولار في جولة حوكمة بيانات، لكن التأثير لم يكن ملحوظًا؛

وأخيرًا، مهندس خوارزمية من الدرجة الأولى.تحتاج الخوارزميات إلى التخصيص وفقًا للسيناريوهات الطبية لحل مشكلة "الصندوق الأسود" والتعرف على "الهلوسة".

الرعاية الصحية الذكية: الابتكار القائم على البيانات في نماذج الرعاية الصحية

كما هو موضح في الشكل أدناه، منذ عام ١٩٥٠، انخفض عدد الأدوية الجديدة المعتمدة لكل مليار دولار أمريكي من استثمارات البحث والتطوير إلى النصف تقريبًا كل تسع سنوات. وقد ظل هذا الاتجاه مستقرًا للغاية على مدار الستين عامًا الماضية. تُعرف هذه الظاهرة في صناعة الأدوية بقانون مور المضاد.إن تكاليف تطوير الأدوية الجديدة تتزايد باستمرار، كما أن البحث والتطوير في مجال الأدوية يواجه أزمة إنتاجية خطيرة.

اتجاهات صناعة الأدوية

لا ينطبق هذا على صناعة الأدوية فحسب، بل على الصناعة الطبية بأكملها. كما هو موضح في الشكل أدناه،وبحسب إحصاءات عام 2018، بلغ عدد المستشفيات من الدرجة الثالثة في الصين 7.63% من إجمالي عدد المرضى الخارجيين في البلاد، لكنها كانت مسؤولة عن 50.97% من إجمالي عدد المرضى الخارجيين في البلاد.ظهرت سلسلة من المشاكل، منها التوزيع غير المتكافئ للموارد الطبية، وانخفاض كفاءة التشخيص والعلاج، والضغط الناجم عن التغيرات في طيف الأمراض الناتجة عن شيخوخة السكان. لذلك، في عصر الرعاية الصحية الذكية، من الضروري أن يُسرّع الذكاء الاصطناعي التحول الطبي.

الموارد الطبية والاحتياجات التشخيصية في بلدي في عام 2018 
(الوحدة: أسرة، 100 مليون شخص، %)، المصدر: اللجنة الوطنية للصحة (جمعها معهد أبحاث الصناعة المستقبلية)

خوارزمية توجيه الانحدار اللوجستي التقليدية كمعيار مرجعي

مع تبني المجالات السريرية والصيدلانية لتوجه الذكاء الاصطناعي، يُمكن استخدام الانحدار اللوجستي التقليدي في الأبحاث السريرية، إلا أنه يعاني من عيوب كبيرة. فعلى سبيل المثال، عند دراسة التقييم الكمي للعلاقة بين تلوث الهواء طويل الأمد وتليف عضلة القلب، عادةً ما تجمع الطرق التقليدية الخصائص الاجتماعية والديموغرافية والمؤشرات الحيوية وتقارير التصوير (أوميكس غير تصويرية)، وتُدمج متغيرات مثل PM2.5 وPM10 في النموذج، وتُحلل ارتباطها بأمراض (مثل تليف الجسم).

مع ذلك، يعاني هذا النوع من تحليل الارتباط منذ سبعينيات القرن الماضي من عيوب جوهرية: إذ يحتاج البحث الطبي إلى استكشاف العلاقة السببية، بينما لا تستطيع الطرق التقليدية اكتشاف ارتباط المتغيرات المحددة مسبقًا، ولا يمكنها اكتشاف عوامل خطر جديدة لم تُفحص مسبقًا في النموذج، مما يؤدي إلى الوقوع في مفارقة دورة "البيضة والدجاجة". إضافةً إلى ذلك،يواجه تحليل الارتباط التقليدي صعوبة في التعامل مع تفاعلات المتغيرات، وعادةً ما يقتصر على تحليل تفاعلات عاملين أو ثلاثة فقط. ولا يمكنه استيعاب مئات أو آلاف المتغيرات، ولا يمكنه الوصول مباشرةً إلى بيانات الصور.

في المقابل،يتمتع التحليل الخوارزمي بمزايا كبيرة: فهو قادر على التعامل مع التفاعلات المتعددة المتغيرات، ودمج كميات هائلة من البيانات (بما في ذلك الصور)، ومن خلال التدريب المتكرر للرموز (يتم تشغيلها 10000 أو حتى 100 مليون مرة)،إذا استمر عامل الخطر، فيمكن اعتباره "سببيًا"، وهو أقرب إلى العلاقة السببية المطلوبة للبحث الطبي.

إعادة بناء العناصر الأربعة للذكاء الاصطناعي الطبي: تخصيص الموارد حسب الأولوية

الرعاية الصحية الذكية نموذج طبي جديد يستخدم تكنولوجيا المعلومات الحديثة لتحسين الخدمات الطبية وإدارتها، ويهدف إلى تحسين الكفاءة الطبية، وخفض التكاليف الطبية، وتحسين تجربة المرضى. ويرتكز هذا النموذج على البيانات الضخمة، والحوسبة السحابية، وإنترنت الأشياء، والذكاء الاصطناعي.

في الإدراك التقليدي، العناصر الثلاثة للذكاء الاصطناعي هي الخوارزميات، وقوة الحوسبة، والبيانات.ومع ذلك، في السيناريو الطبي، نقترح "نظرية العناصر الأربعة"، وهي الخوارزمية، وقوة الحوسبة، والبيانات، وسيناريوهات التطبيق، مع نسبها على التوالي 10%، و30%، و40%، و20%.نظرًا لضآلة الاختلاف بين الخوارزميات المحلية والدولية، ولأن معظمها مفتوح المصدر، فإنها تُمثل أقل نسبة من عناصر الذكاء الاصطناعي الطبي؛ ويمكن تخفيف قوة الحوسبة عن طريق استئجار قوة الحوسبة السحابية؛ وتُستخدم سيناريوهات التطبيق كعامل مساعد لتوفير الدلالات لتحويل الاحتياجات السريرية إلى "مهام" يفهمها النموذج. ومن هنا، وجدنا أن "البيانات" هي العامل الحاسم. تتصدر الصين العالم من حيث حجم البيانات الطبية، إلا أن انخفاض معدل التحول الإلكتروني جعلها "منجمًا ذهبيًا غير مُستغل". وتشير التقديرات إلى أنه بحلول عام 2028، سيكون من الصعب تلبية احتياجات النماذج الكبيرة بسبب نمو البيانات الطبية المنظمة التقليدية في العالم (بدأ جمع البيانات عام 1550)، وستصبح الصين قاعدة البيانات الأساسية للبحث والتطوير الطبي العالمي نظرًا لعدم اكتمال معلومات بياناتها التاريخية.

نهجان لتدريب البيانات الطبية

يشكك الكثيرون في جدوى تدريب النماذج الكبيرة، مثل إمكانية استخدام بيانات المستشفيات مباشرةً للتدريب. مع ذلك، وبناءً على التجربة، فإن هذا النهج غير قابل للتطبيق.هناك طريقتان لتدريب النماذج الكبيرة.

أولاً، تتجاوز متطلبات البيانات الخاصة بالنماذج الكبيرة متطلبات البيانات الخاصة بالأبحاث السريرية إلى حد كبير.على الرغم من صعوبة إدارة المستشفيات للبيانات بما يكفي لاستخدامها في الأبحاث السريرية، إلا أن تدريب النماذج الكبيرة يتطلب بيانات أكثر. ويرجع ذلك إلى أن النماذج الكبيرة، رغم امتلاكها قدرات تعلم غير خاضعة للإشراف، تُشبه الاعتماد على التعلم غير الخاضع للإشراف نمو الطبيب تلقائيًا ليصبح رئيسًا للأطباء، وهو أمر بطيء للغاية ولا يلبي الاحتياجات الفعلية. لتسريع التدريب، يجب تزويده بشجرة قرارات الطبيب، بحيث لا يمكنك ببساطة إدخال البيانات في النموذج الكبير، بل تحتاج إلى معالجة البيانات وتحسينها بشكل أعمق.

ثانياً، إذا أرادت المستشفيات استخدام نماذج كبيرة للتدريب بشكل مباشر، فيجب عليها اعتماد نموذج حوكمة البيانات "المكتبة + مكتبة المتخصصين + مكتبة الأمراض الخاصة + مكتبة المشاريع الخاصة".طُوِّر هذا النموذج بعد دمج الدراسات العملية لعدة مستشفيات، مثل مستشفى تيانتان، ويُعتبر نموذج بيانات أكثر ملاءمةً حاليًا لتدريب النماذج الكبيرة. يُتيح هيكل حوكمة البيانات الهرمي هذا توفير بيانات عالية الجودة ومنهجية للنماذج الكبيرة بطريقة أكثر استهدافًا، مما يُحسّن فعالية وكفاءة تدريب النماذج الكبيرة.

مثال على رسم تخطيطي لبناء قاعدة بيانات خاصة

أبحاث أمراض القلب والأوعية الدموية والسكري: نموذج للابتكار القائم على البيانات

وأخيرًا، اسمحوا لي أن أتحدث بإيجاز عن دراستين أجريناهما استنادًا إلى الرعاية الصحية الذكية.

الذكاء الاصطناعي للقلب والأوعية الدموية: من "الأجهزة القابلة للارتداء" إلى "نماذج القلب الكاملة"

وفقًا لتوقعات ستاتيستا لحجم سوق الرعاية الصحية الذكية العالمي في عام ٢٠٢٥، يُشكل مجال أمراض القلب والأوعية الدموية ربع هذا السوق، مما يجعله أكبر قطاعات السوق. وتمر الرقمنة بمراحلها الحادة ومراحل التعافي من أمراض القلب والأوعية الدموية.

بعد إطلاق الجيل الأول من ساعة آبل، حقق سلكها الواحد تنبؤات أكثر دقة من اثني عشر سلكًا، وتمكن من تحديد الرجفان الأذيني (AFib) وأنواع أخرى من اضطرابات نظم القلب لدى مرتديها، محققًا بذلك ابتكارًا في مجال الرعاية الصحية الأولية. واستنادًا إلى هذا الإلهام،اقترح فريقنا الفرضية التالية: "بما أن شكل موجة تخطيط القلب (ECG) المستند إلى الأجهزة القابلة للارتداء يمكنه التنبؤ بعدم انتظام ضربات القلب في وقت مبكر، فهل يمكن للأجهزة القابلة للارتداء الأخرى التي لا تحتوي على وظيفة تخطيط القلب تحقيق نفس التأثير فقط من خلال معدل ضربات القلب؟"بعد سلسلة من عمليات التحقق، وجدنا أن أجهزة أخرى قادرة على تحقيق نفس التأثير بدقة تصل إلى 99.67%. جمع فريقنا نبضات القلب في الدقيقة من أساور رياضية عادية خلال 24 ساعة للتنبؤ بمدة عدم انتظام ضربات القلب.

مقارنة بين نماذج مختلفة بناءً على 3 تخطيطات كهربائية القلب

المضي قدما،طرحنا فرضية ثانية: "بالإضافة إلى أشكال موجات تخطيط القلب ومعدل ضربات القلب، هل يمكن التنبؤ مبكرًا باضطرابات نظم القلب؟ هل انقباض/استرخاء حجرات القلب الأربع له علاقة باضطرابات نظم القلب؟ وإذا كان الأمر كذلك، فهل يمكن التنبؤ به؟"بعد مزيد من التحقق من قِبلنا، أصبح بإمكان "نموذج القلب الكامل" الذي يدمج بيانات متعددة الأبعاد، مثل بيانات القلب والأوعية الدموية والأعصاب والعضلات، تجميع بيانات القلب من خلال خوارزميات. تُظهر النتائج النهائية أن دمج جميع بيانات وظائف القلب للتنبؤ بخطر عدم انتظام ضربات القلب يمكن أن يحقق تنبؤًا دقيقًا بخطر الإصابة بالمرض لمدة تصل إلى 15 عامًا. نُشرت النتائج ذات الصلة في مجلة فرعية تابعة لـ JACC (عامل التأثير 24+).

عنوان الورقة:قياس حجم حجرة القلب باستخدام التصوير المقطعي المحوسب المدعوم بالذكاء الاصطناعي يتنبأ بالرجفان الأذيني والسكتة الدماغية بشكل مماثل للتصوير بالرنين المغناطيسي

عنوان الورقة:https://www.jacc.org/doi/abs/10.1016/j.jacadv.2024.101300

التنبؤ بالرجفان الأذيني على المدى الطويل (15 عامًا)

أبحاث مرض السكري: من "طيف المضاعفات" إلى "الآلية السببية"

دراسة أخرى هي تحليل شبكة الأمراض استنادًا إلى نموذج كبير. سابقًا، كان يُعتقد أن داء السكري المبكر (الذي يبدأ قبل سن الأربعين) أخف من داء السكري الطبيعي. على سبيل المثال، قد يتمتع الشخص الذي يُصاب بداء السكري في سن العشرين بضغط دم ودهون دم طبيعية دون أي مضاعفات في سن الثلاثين، بينما قد يعاني الشخص الذي يُصاب بداء السكري في سن الأربعين من مؤشرات غير طبيعية وأمراض أخرى في سن الخمسين. ومع ذلك، من خلال دراسة طيف مضاعفات داء السكري في الجسم كله، وُجد أنإن التفاعلات النظامية لمضاعفات مرض السكري المبكر تكون أكثر كثافة، وهناك ارتباطات بين المسارات المتجهة، والتي تختلف عن الإدراك الفطري للناس.

الطيف المميز للمضاعفات في مرض السكري من النوع 2 المبكر
(يسار: مرض السكري المبكر؛ يمين: مرض السكري الذي يتم تشخيصه عادةً؛ كل دائرة بألوان مختلفة تمثل نظامًا مختلفًا)

نظرة مستقبلية: نموذج جديد للرعاية الصحية في عصر ذكاء البيانات

في السنوات الأخيرة، يشهد الذكاء الاصطناعي الطبي في الصين تسارعًا ملحوظًا. وكما قال الأكاديمي لي غوجيه: "يدخل البشر الآن مرحلة الذكاء في عصر المعلومات، ويتجهون نحو عصر الذكاء. وقد برز نموذج البحث العلمي الذكي، ويمكن أن يصبح "نموذج البحث العلمي الخامس". لا يمكننا أن نخطئ في فهمنا للعصر. إذا فوتنا فرصة تحول العصر، فسنتعرض لضربة تاريخية من تقليص الأبعاد".

وفي المستقبل، علينا أن نعمل على المجالات التالية:

* مستوى الطبيب:إن البيانات هي اتجاه لا مفر منه في المستقبل، والتعاون بين التخصصات المتعددة (الجمع بين الطب والهندسة) هو شرط ضروري لإجراء البحوث المبتكرة باستخدام البيانات.إن تنمية المواهب البرمائية "الطبية + البيانات" تشكل أولوية قصوى.يحتاج الأطباء إلى إتقان بعض المعارف المتعلقة بالذكاء الاصطناعي (مثل تقييم النماذج وتفسير البيانات) من أجل التعاون بشكل أفضل مع مهندسي الخوارزميات وعلماء البيانات لتحسين تأثير تطبيق الذكاء الاصطناعي في الرعاية الصحية.

مستوى الخوارزمية:تواجه النماذج المعتمدة على البيانات اليوم مشكلة ارتفاع تكاليف التدريب. نأمل مستقبلًا في تطوير نماذج خفيفة الوزن تناسب الحالات الطبية.خفض عتبة قوة الحوسبة وتحسين القدرة على التفسير وموثوقية التطبيق السريري للخوارزمية.وعلى وجه الخصوص، سوف يؤدي ذلك إلى زيادة قبول الذكاء الاصطناعي بين الأطباء والمرضى ودمج الذكاء الاصطناعي في الرعاية الطبية.

مستوى المستشفى:عندما لا تتوفر لديكم أفكار بحثية جيدة وتجدون صعوبة في الابتكار، فمن الأفضل البدء بالبيانات والاستفادة من أحدث أساليب البحث في علوم المعلومات. لذلك، ينبغي على المستشفيات تشجيع البحث العلمي وتقديم دعم قوي له. يجب تجهيز غرف بيانات البحث العلمي بأنظمة الحوسبة والتخزين والشبكات والأمن وغيرها من البنى التحتية المناسبة لتوفير خدمات أساسية للابتكار الطبي على مستوى البيانات.

مع أن النموذج الشامل ليس حلاً سحريًا، إلا أن التفكير القائم على البيانات يُعيد صياغة جوهر الطب. عندما نتعلم حقًا سرد القصص بالبيانات وإيجاد الحلول بالخوارزميات، يُمكننا دمج "ذكاء البيانات + الجوهر الطبي" بشكل عميق لنُبادر بالابتكار الطبي ونجعل الطب الذكي يخدم المرضى ويعود بالنفع على المجتمع.

نبذة عن البروفيسور لي دونغ

البروفيسور لي دونغ، الحاصل على دكتوراه في الطب، خبيرٌ عالميٌّ مرموقٌ في علوم البيانات الطبية. يشغل حاليًا منصب مدير مركز علوم البيانات الطبية في مستشفى تسينغهوا تشانغ غونغ ببكين التابع لجامعة تسينغهوا، وهو أستاذٌ مرموقٌ في الهندسة الحيوية بجامعة تسينغهوا. شغل البروفيسور لي دونغ منصب أول مديرٍ صينيٍّ لمركز الأبحاث السريرية في مركز هاربور الطبي بجامعة كاليفورنيا، لوس أنجلوس، وعُيّن أستاذًا مرموقًا في مستشفى غرب الصين بجامعة سيتشوان.

نشر البروفيسور لي دونغ أكثر من 100 ورقة بحثية في مجال علوم الحاسوب في مجلات أكاديمية دولية مرموقة، استُشهد بها ما يقرب من 4000 مرة خلال السنوات الخمس الماضية. كما نشر أكثر من 220 ملخصًا لمؤتمرات أكاديمية. بالإضافة إلى ذلك، دُعي لإلقاء أكثر من 40 محاضرة أكاديمية، وشارك في كتابة 4 دراسات أكاديمية، وحصل على براءتي اختراع.

تغطي أبحاثه طيفًا واسعًا من المجالات، بما في ذلك تصميم البحوث السريرية، والقياس والتقييم، وتحليل النمذجة، واستخراج البيانات الطبية، وتطبيقات الذكاء الاصطناعي في الطب. يتمتع بخبرة واسعة في قيادة فرق البحوث السريرية لإجراء استخراج البيانات الطبية الضخمة وتطوير أنظمة تحليل القرارات الطبية الذكية، وهو مرجع معترف به في هذا المجال.