HyperAI

عيادة العميل النفسية متاحة الآن على الإنترنت! استنادًا إلى 1.3 ألف حوار استشارة حول الاكتئاب، قام فريق جامعة شنغهاي جياوتونغ ببناء وكيل حوار نموذجي كبير يمكنه تشخيص الاكتئاب

特色图像

تشكل قضايا الصحة العقلية واحدة من أكبر التحديات التي تواجه المجتمع اليوم. وبحسب تقرير الصحة النفسية العالمي الصادر عن منظمة الصحة العالمية، يعاني حوالي 246 مليون شخص من اضطرابات الاكتئاب، بمعدل 3153 حالة لكل 100 ألف شخص. يمكن القول أن هذا هو أحد الاضطرابات العقلية الأكثر شيوعًا.

ومع ذلك، تظل الموارد الصحية المخصصة للصحة العقلية غير كافية اليوم، وخاصة في البلدان المنخفضة والمتوسطة الدخل. وبالإضافة إلى ذلك، في جميع البلدان والمناطق،تتركز الموارد الطبية المتخصصة في الصحة النفسية بشكل رئيسي في المدن والمؤسسات الكبيرة، مما يؤدي إلى اختلال التوازن في تخصيص موارد المستشفيات.وهذا يجعل من الصعب على المرضى الذين يعانون من اضطرابات نفسية مثل الاكتئاب الحصول على المساعدة الطبية المناسبة في الوقت المناسب.

من أجل تخصيص الموارد الطبية بشكل أفضل وتخفيف معضلة قيود الموارد، فإن طرق تشخيص الاكتئاب الآلية الدقيقة والفعالة مهمة وحاسمة. من بين طرق التشخيص الآلية المختلفة، تعتبر العوامل المحادثة فعالة للغاية بسبب فعاليتها من حيث التكلفة وتوفير الوقت والحفاظ على إخفاء هوية المستخدم. ومن الجدير بالذكر أنه مع تقدم المحادثة التشخيصية،يجب أن تتغير استراتيجية الحوار الخاصة بالوكيل وفقًا للحالة العقلية للمريض وتقدم العلاقة بين الطبيب والمريض.ولا شك أن هذا يشكل تحديًا خطيرًا لبناء وكلاء الحوار.

ردا على المشاكل المذكورة أعلاه،قام فريق البروفيسور Mengyue Wu من مختبر X-LANCE بجامعة شنغهاي جياو تونغ، بالتعاون مع جامعة تكساس في أرلينجتون (UTA)، ومعهد Tianqiao Brain Science (TCCI) وThetaAI، ببناء نظام محاكاة وكيل الحوار الآلي كبير الحجم - Agent Mental Clinic (AMC).يستخدم للتشخيص الأولي للاكتئاب. يمكن لهذا النظام محاكاة طبيب نفسي ومريض اكتئاب محتمل في نفس الوقت، ومحاكاة محادثة استشارة الاكتئاب. بالإضافة إلى ذلك، من أجل تحسين عملية المحادثة وتوجيه الأطباء النفسيين، صممت AMC أيضًا دورًا للمدرب لتزويد الأطباء النفسيين بالتوجيه للجولة التالية من المحادثة. يمكن لعب كافة الأدوار في النظام بواسطة أشخاص حقيقيين أو تنفيذها بواسطة نماذج كبيرة.

من أجل التكيف بشكل أفضل مع احتياجات بيئة التشخيص، تستخدم AMC أفكار بناء الوكيل النموذجي الكبير الشائع، وتقترح أيضًا بنية تخزين ذاكرة ثلاثية الطبقات وآلية استرجاع ذاكرة جديدة لتحقيق استشارة اكتئاب وفحص أولي أكثر كفاءة ودقة. لا يمكن استخدام نظام الحوار هذا للفحص الأولي للمرضى الذين يعانون من الاكتئاب المحتمل فحسب، بل يمكن استخدامه أيضًا لتدريب الأطباء النفسيين المتدربين أو الطلاب، وتقديم بعض التوجيه والمساعدة قبل دخولهم رسميًا إلى القسم للتدريب الداخلي. إن الدور الذي يمكن أن يلعبه المدرب الذي يمكن أن يلعبه الأطباء النفسيون المحترفون يوفر أيضًا أفكار تحسين قابلة للتطبيق لوكيل الطبيب النفسي بناءً على النموذج الكبير.

وقد تم نشر البحث ذي الصلة، بعنوان "محاكاة حوار تشخيص الاكتئاب: طبيب نفسي متطور يتمتع بالذاكرة الثلاثية"، كنسخة أولية.

أبرز الأبحاث:

* تم بناء نوع جديد من نظام محاكاة وكيل الحوار لمحاكاة المحادثة التشخيصية بين وكيل المريض ووكيل الطبيب النفسي، مما يوفر طريقة جديدة فعالة لتدريب المتدربين على الطب النفسي والفحص الأولي لمرضى الاكتئاب المحتملين.

* اقتراح بنية ذاكرة مبتكرة ثلاثية الطبقات ووحدة استرجاع الذاكرة لتعزيز مهارات التلخيص لدى العميل في مرحلة التشخيص، مما يوفر اتجاهًا جديدًا لتحسين تشخيص الاكتئاب ومحاكاة الحوار في المستقبل.

* لقد أدى نظام AMC إلى تحسين تشخيص الاكتئاب والتنبؤ بالانتحار، ويمكن تطبيق الإطار على مجالات محددة أخرى وهو مناسب للتدريب على حالات محدودة محددة.

عنوان الورقة:
https://arxiv.org/abs/2409.15084

يجمع المشروع المفتوح المصدر "awesome-ai4s" أكثر من مائة تفسير ورقي لـ AI4S ويوفر مجموعات وأدوات ضخمة من البيانات:

https://github.com/hyperai/awesome-ai4s

د4 مجموعة البيانات، تم التحقق منها من قبل أطباء محترفين

د4 تم جمع مجموعة البيانات من قبل فريق البروفيسور وو مينغيو وتم التحقق من جودتها من قبل أطباء محترفين.تتضمن عملية جمع مجموعة بيانات الحوار ثلاث مراحل:

* توزيع الاستبيانات على وسائل التواصل الاجتماعي والمنصات الأخرى لجمع وبناء صور شخصية لمرضى الاكتئاب المحتملين الحقيقيين.

* تجنيد وتدريب المرضى المحاكيين والأطباء المحاكيين، وتزويد المرضى المحاكيين بالصور المجمعة لمرضى الاكتئاب، ثم جعل الأطباء المحاكيين والمرضى المحاكيين يجرون حوارًا استشاريًا حول الاكتئاب.

* سيتم تسليم المحادثات المحاكاة المجمعة إلى أطباء نفسيين متخصصين للتحقق من جودة محادثات الاستشارة، وسيتم إجراء ملخص لشدة الاكتئاب والأعراض للمحادثات التي تلبي معايير الجودة.

3 مراحل لجمع مجموعة بيانات D4

بعد التجميع والتحقق، جمع فريق البروفيسور وو مينغيو إجمالي 1339 محادثة ذات جودة مرضية لبناء مجموعة بيانات استشارة الاكتئاب D4. تم تقسيم درجة الاكتئاب إلى أربع فئات رئيسية: لا شيء (430 محادثة)، خفيف (342 محادثة)، متوسط (368 محادثة)، وشديد (199 محادثة)، بمتوسط عدد جولات المحادثة 21.6 جولة. بعد ذلك، اقترح فريق البروفيسور وو مينغيو إطار عمل لتوضيح تشخيص أعراض الاكتئاب من خلال تحسين محركات البحث لمجموعة البيانات D4.

بنية ذاكرة مبتكرة ثلاثية الطبقات ووحدة استرجاع الذاكرة

واقترح الباحثون نظام محاكاة وكيل الحوار الآلي ذو النموذج الكبير مع بنية تخزين ذاكرة ثلاثية الطبقات وآلية جديدة لاسترجاع الذاكرة، والتي تتضمن ثلاث وحدات:
* وكيل المريض:يتم تهيئة وكيل المريض باستخدام معلومات المستخدم المستخرجة من صورة المستخدم D4 وحوار استشارة الاكتئاب. اختارت AMC 100 حالة كلاسيكية من D4 كمجموعة تدريب، واستخدمت GPT-4 لاستخراج معلومات الحدث من حوار الاستشارة الطبية كعقدة ذاكرة أولية للمريض.

* وكيل الطبيب النفسي:تم استخدام الوصف والأساس التشخيصي للاضطرابات الاكتئابية في ICD-11 للتهيئة، وتم تجميع السجلات الطبية الإلكترونية للمريض ومهارات التشخيص المختصرة مع تقدم التشخيص.

* مكون إضافي للمشرف:يتم استخدامه لمقارنة نتائج تشخيص وكيل الطبيب النفسي مع وكيل المريض، وتلخيص التجربة وتسليمها إلى وكيل الطبيب النفسي للتخزين.

نظرة عامة على نظام AMC

تظهر عملية تشغيل نظام AMC بأكمله في الشكل، والذي يتكون من 6 خطوات في المجموع:

1. قم بتهيئة مجموعة من وكلاء المرضى باستخدام صور المرضى التي تم إنشاؤها بواسطة GPT-4 استنادًا إلى البيانات التي تم جمعها بواسطة D4. لن يتم تقديم نتائج تشخيص الاضطرابات الاكتئابية إلى وكيل المريض أثناء عملية استشارة المريض. 2. يتحدث وكيل المريض ووكيل الطبيب النفسي حول استشارة الاكتئاب.

3. خلال الخطوة الثانية، سوف يقوم البرنامج المساعد للمدرس بتتبع الأعراض التي ذكرها المريض وتزويد الوكيل النفسي باقتراحات للخطوة التالية من المحادثة بناءً على تقدم المحادثة.

4. بعد انتهاء حوار الاستشارة، يقوم البرنامج المساعد للمدرب بمقارنة التشخيص النهائي الذي أجراه وكيل الطبيب النفسي للمريض مع تشخيص الطبيب الحقيقي المخزن في D4. 5. سيقوم البرنامج المساعد للمدرس بتلخيص الإرشادات المقدمة لوكيل الطبيب النفسي بناءً على مقارنة نتائج التشخيص وتقديمها لوكيل الطبيب النفسي.

6. بعد الانتهاء من عملية الاستشارة، يقوم الطبيب النفسي باستدعاء المريض التالي للتشخيص ويكرر العملية.

عملية تشغيل نظام AMC

لاسترجاع الذاكرة الملائمة بشكل أفضل لمعالجة المحادثات والتشخيصات،قام الباحثون ببناء بنية ذاكرة وكيل مكونة من ثلاث طبقات: سجل المحادثة، والسجلات الطبية الإلكترونية، ومهارات التلخيص.في:

* تاريخ التشخيص هو سجل تاريخ الحوار الحالي؛

* السجلات الطبية الإلكترونية (EMRs) هي عبارة عن ملخصات للمحادثات التي كتبها الوكيل النفسي بعد كل استشارة للمريض، بما في ذلك شكاوى المريض وأعراضه ومعلومات الأحداث الأخرى؛

* مهارات التشخيص هي آراء إرشادية يلخصها البرنامج المساعد للمعلم ويتم تخزينها في ذاكرة وكيل الطبيب النفسي، مما يساعد على تحسين عملية المحادثة ودقة التشخيص.

هندسة الذاكرة ثلاثية الطبقات من AMC

الاستنتاج التجريبي: تحسين دقة تشخيص الاكتئاب والميول الانتحارية

لتقييم فعالية AMC، أجرى الباحثون مجموعتين من التجارب على مجموعة اختبار D4.

أحدها هو استخدام الحوار الأصلي لـ D4 كحوار استشاري بين وكيل الطبيب النفسي ووكيل المريض لإجراء التشخيص، والذي يستخدم لاختبار القدرة التشخيصية للنموذج. الثاني هو إجراء التشخيص من خلال الحوار بين الطبيب النفسي والمريض، وفحص قدرة الوكيل على لعب الأدوار والقدرة التشخيصية بشكل شامل.

قام الباحثون بحساب دقة التشخيص لاضطرابات الاكتئاب والانتحار بشكل منفصل (تم تصنيفها على أنها لا شيء، خفيفة، معتدلة، وشديدة). من خلال مقارنة نظام AMC مع الذاكرة وبدونها، تظهر النتائج أن الأداء العام للنموذج على مجموعة الاختبار قد تحسن.تم التحقق من فعالية AMC في الاستفادة من بنية الذاكرة الهرمية، ويمكن تحسين كل من التشخيص البسيط والحوار + التشخيص إلى حد ما.

النتائج التجريبية حول تشخيص الاكتئاب

من أجل التحقق بشكل أكبر من فعالية بنية الذاكرة ثلاثية الطبقات،أجرى الباحثون تجربة استئصال ووجدوا أن إضافة ذاكرة السجلات الطبية الإلكترونية ومهارات التلخيص في نفس الوقت يمكن أن يؤدي إلى تحسن مستقر في دقة النموذج، مما يثبت فعالية بنية الذاكرة ثلاثية الطبقات.

نتائج تجارب الاستئصال لبنية الذاكرة ثلاثية الطبقات

للتحقق من فعالية البرنامج الإضافي للمدرس،وأجرى الباحثون أيضًا تجارب الاستئصال على المكونات الإضافية. تظهر التجارب أن البرنامج الإضافي للمدرس له أيضًا تأثير تحسين معين على بنية نظام AMC.

نتائج تجربة الاستئصال للمكون الإضافي للمدرب

اكتشف أسرار الصوت

في السنوات الأخيرة، أظهرت الذكاء الاصطناعي قدرات قوية في تشخيص وعلاج أمراض مختلفة، مثل الكشف الصوتي عن أمراض الجهاز التنفسي والجهاز الهضمي. ومع ذلك، كان التقدم في تشخيص وعلاج الأمراض العقلية بطيئا بسبب عدم وجود بيانات ذات جودة عالية ذات صلة. والسبب هو أن معظم المرضى الذين يعانون من أمراض عقلية ما زالوا يشعرون بالخجل من مرضهم، كما أن السجلات الطبية ذات الصلة تنطوي على خصوصية المريض، لذلك من الصعب تشكيل مجموعة بيانات واسعة النطاق لتدريب نموذج الذكاء الاصطناعي.

الاتجاه البحثي الرئيسي لمجموعة أبحاث وو مينغيو هو الطب النفسي الحسابي وأبحاث الكلام المرضي في فهم الصوت.إن مجموعة البيانات D4 المستخدمة في البحث المذكور أعلاه هي أول مجموعة بيانات مفتوحة المصدر في العالم لحوار استشارة الاكتئاب والتي تلبي المعايير السريرية، والتي بناها فريقها، مما يوفر أساسًا متينًا للبحوث ذات الصلة.

ومن الجدير بالذكر أن المعلم وو مينغيو يتمتع بخبرة شخصية غنية، ولديه خلفية في مجال البحث النفسي الصوتي، وهو ملتزم بدمج الذكاء الاصطناعي مع أبحاث الصحة العقلية. أجرت HyperAI مقابلة معمقة مع البروفيسور وو مينغيو.اضغط هنا لمشاهدة التقرير الكامل: وو مينغيو من جامعة شنغهاي جياو تونغ: استخدام تكنولوجيا الذكاء الكلامي لإصدار أول تشخيص وأمر علاج للأمراض العقلية.

المؤلف الأول لهذه الورقة البحثية هو لان كونياو، وهو طالب دكتوراه. طالب في قسم علوم الكمبيوتر، كلية المعلومات الإلكترونية والهندسة الكهربائية، جامعة شنغهاي جياو تونغ.تخرج من جامعة شنغهاي جياو تونغ بدرجة البكالوريوس في أمن المعلومات. اتجاهه البحثي الرئيسي هو نظام الحوار لتشخيص وعلاج الأمراض العقلية. فاز بالجائزة الثانية في مسابقة ابتكار التكنولوجيا والتطبيقات الطبية الرياضية لعام 2023 والجائزة الأولى في المسابقة الوطنية الثالثة عشرة لأمن المعلومات للطلاب الجامعيين.

لان كونياو، دكتوراه، قسم علوم الكمبيوتر، كلية هندسة المعلومات الإلكترونية والكهربائية، جامعة شنغهاي جياو تونغ

مختبر X-LANCE التابع لجامعة شنغهاي جياو تونغ والذي تنتمي إليه مجموعته البحثية يُعرف باسم مختبر ذكاء اللغة عبر الوسائط التابع لجامعة شنغهاي جياو تونغ.تأسس في عام 2012، وكان يُعرف سابقًا باسم مختبر الكلام الذكي (SpeechLab). بعد سنوات من التطوير، أصبح "مختبرًا لذكاء اللغة متعدد الوسائط" يغطي جميع مجالات البحث الأساسية في معالجة المعلومات اللغوية السمعية والبصرية.

صورة الذكرى السنوية الثانية عشرة للمختبر

حاليًا، يتكون أعضاء هيئة التدريس في مختبر الذكاء اللغوي عبر الوسائط من أستاذ واحد و4 أساتذة مشاركين ومساعد بحث واحد، مع أكثر من 20 طالب دكتوراه، وأكثر من 30 طالب ماجستير، وأكثر من 30 طالب جامعي من فصول ACM، وفصول الذكاء الاصطناعي، وفصول IEEE، وتخصصات علوم الكمبيوتر في كلية الهندسة الكهربائية، ومعهد باريس للتميز، ومعهد ميشيغان، إلخ.

حصل المختبر على الدعم من العديد من المشاريع الوطنية والشركات، بما في ذلك برنامج البحث والتطوير الوطني الرئيسي وصندوق العلماء الشباب المتميزين التابع للمؤسسة الوطنية للعلوم الطبيعية في الصين. تعاون المختبر بشكل وثيق مع شركة AISpeech Technology المحدودة لإنشاء "مختبر التفاعل الذكي بين الإنسان والحاسوب AISpeech التابع لجامعة شنغهاي جياو تونغ". يمكن للمختبر تعبئة موارد بيانات غنية وموارد حوسبة وفيرة تصل إلى مئات من بطاقات GPU من طراز H800 وA800 وA10 وغيرها. وهو أحد مختبرات الذكاء الاصطناعي القليلة جدًا في العالم التي يمكنها إجراء تحليلات وأبحاث واسعة النطاق على المستوى الصناعي.

نرحب بالطلاب ذوي الخلفية النفسية والاهتمام بالصحة العقلية الحاسوبية للانضمام إلى البحث ~
الصفحة الرئيسية للمختبر:

https://x-lance.github.io/zh