HyperAI

عدد خاص بيوم المرأة | وو مينغيو من جامعة شنغهاي جياوتونغ: استخدام تكنولوجيا الذكاء الكلامي لإصدار أول أمر تشخيص وعلاج للأمراض العقلية

特色图像

من ثرثرة الأطفال، إلى قصص الشباب التي لا تنتهي، ثم إلى منتصف العمر، نسمع مخاوف وتحذيرات الآباء والشيوخ، فضلاً عن الحث المستمر لضغوط الحياة... إذا فكرنا ملياً، فإن تجارب وذكريات كل مرحلة من مراحل الحياة مليئة بأصوات مختلفة. إن زقزقة الحشرات في الصيف والضوضاء في ملعب كرة السلة هي الشباب، والتنهدات في المساء وأصوات إشعارات رسائل الهاتف المحمول هي النمو. وكما أن الناس لا يستطيعون إيقاف سمعهم تمامًا حتى لو غطوا آذانهم بإحكام أو ارتدوا سماعات إلغاء الضوضاء، فإن الصوت موجود في كل مكان.

من وجهة نظر فيزيائية، الصوت هو موجة صوتية تنشأ عن اهتزاز الأجسام ويمكن أن تنتقل عبر الوسط الهوائي. لذلك، لا يمكن عزل الصوت إلا في بيئة خالية من الهواء تمامًا. ومن منظور آخر، فإن الصوت، باعتباره ناقلاً للغة، لا يعد وسيلة مهمة للتواصل فحسب، بل إنه أيضاً منفذ للتعبير عن المشاعر. مع التطور القوي للذكاء الاصطناعي، أصبحت التكنولوجيا التحليلية والقدرات ذات الصلة أقوى بشكل متزايد. أصبحت الموجات الصوتية التي كانت تطفو في الهواء في الأصل بيانات يمكن دراستها ويمكنها حتى أن تعكس الحالة الصحية لجسم الإنسان.

في السنوات الأخيرة، بدأت تقنية الكشف عن الأمراض القائمة على الكلام في الظهور في مجالات طب الجهاز التنفسي وأمراض القلب وأمراض الجهاز الهضمي وغيرها.وبالمقارنة، فإن استخدام الصوت في تشخيص وعلاج الأمراض العقلية مختلط:والقلق هو أن هناك نقصًا خطيرًا في البيانات الصوتية ذات الصلة (ويرجع ذلك أساسًا إلى طبيعة الخصوصية العالية للأمراض العقلية)؛ والخبر السار هو أن التشخيص عبر الإنترنت للمرض بناءً على الصوت يمكن أن يساعد المرضى على تخفيف شعورهم بالخجل أثناء مرحلة التشخيص الأولية وتحديد ما إذا كانوا مرضى في أقرب وقت ممكن.

ذكر لو لين، الأكاديمي في الأكاديمية الصينية للعلوم، في مقابلة أنه بحلول نهاية عام 2021، كان هناك 6.6 مليون مريض يعانون من اضطرابات نفسية شديدة مسجلين في قاعدة البيانات الوطنية.لا يجوز أن يتجاوز عدد الأشخاص الذين يتلقون العلاج 20%.إن التوسع والترويج بشكل قوي لأساليب التشخيص المعتمدة على التحليل الصوتي له أهمية كبيرة في حل مشكلة انخفاض معدل علاج الأمراض العقلية.

نشر وو مينغيو، الأستاذ المشارك والمشرف على الدكتوراه في قسم علوم الكمبيوتر بجامعة شنغهاي جياو تونغ، نموذج ذكاء الكلام لتشخيص وعلاج الأمراض العقلية.وبناءً على نموذج لغوي كبير، تم محاكاة الأدوار المختلفة للأطباء والمرضى، وبفضل المشاركة المشتركة لأخصائيي تشخيص الأمراض العقلية البشرية، تم إنشاء أول مجموعة بيانات مفتوحة المصدر في العالم لحوار استشارة الاكتئاب والتي تلبي المعايير السريرية.

وو مينغيو أستاذ مشارك، قسم علوم الكمبيوتر، جامعة شنغهاي جياو تونغ، مشرف على الدكتوراه

بمناسبة اليوم العالمي للمرأة، تشرفت شركة HyperAI بإجراء مقابلة معمقة مع السيدة وو مينغيو، وفهمت بشكل أكبر سحر الصوت وتفاعله الرائع مع الذكاء الاصطناعي. وفي الوقت نفسه، رأينا أيضًا كيف انطلقت هذه المرأة ذات العزيمة والحرية من اهتماماتها وحققت إنجازات تدريجية في مجالها المهني.

استمر في إجراء الأبحاث التي يمكن تنفيذها

هناك فروق دقيقة في الجهاز الصوتي، والتجويف الفموي، والتجويف الأنفي، وما إلى ذلك، لدى كل شخص، وبالتالي فإن بصمات الصوت لدى الناس مختلفة مثل بصمات الأصابع والوجوه. كانت وو مينغيو مهتمة جدًا بالطريقة الفريدة التي يتحدث بها الناس مع بعضهم البعض منذ أن كانت طفلة. يمكن القول أن "معرفة الأشخاص من خلال أصواتهم" في الحياة اليومية كان السلم الذي قادها إلى عالم الصوت.

خلال دراستها الجامعية، درست وو مينغيو، التي كانت شديدة الحساسية ومهتمة بالصوت، علم النفس الصوتي في جامعة بكين للمعلمين. خلال هذه الفترة، أدركت أهمية استخدام الخصائص الصوتية الفيزيائية لتفسير الاختلافات الصوتية على المستوى التقني.وفي المرحلة النهائيةتم اختيار النمذجة الحاسوبية لتحليل البيانات الصوتية.

ذهبت وو مينغيو إلى شنشي للتدريس خلال سنوات دراستها الجامعية

إذا كانت المحاولات المبكرة لإجراء أبحاث تحليل الصوت في مجال علم النفس الصوتي خلال المرحلة الجامعية قد زرعت بذرة في قلب وو مينغ يويه، فإن مشروعي البحث المرتبطين اللذين كانت على اتصال وثيق بهما أثناء دراساتها للدكتوراه كانا بمثابة حافز.

أثناء دراستها للدكتوراه، التقى أحد زملائها في الفصل، الذي كان يجري بحثًا في تحليل الصوت حول مرض الفصام، بعدد كبير من المشردين في الشوارع المصابين بالفصام أثناء البحث الميداني. زميل آخر في الغرفة، بعد حصوله على درجة الدكتوراه في علم النفس السريري، دخل سجن ملبورن لإجراء تقييمات للأمراض العقلية للسجناء من أجل شرح ما إذا كانت سلوكياتهم الإجرامية ذات الصلة متأثرة بالأمراض العقلية.

لقد جلبت تجارب هذين الزميلين إلهامًا وتأثيرًا عميقًا إلى وو مينغيو. وبعد عودتها إلى الصين، بدأت بإجراء أبحاث أكثر تعمقًا حول تشخيص وعلاج الأمراض العقلية.

قالتفي مجال علم الأصوات، يعتبر الكلام واللغة في الواقع مظاهر خارجية لوظائف الدماغ البشري. لذلك، سواء كان الأمر يتعلق باضطرابات عاطفية أو خلل إدراكي، فإنها في نهاية المطاف ستترك دلائل في التعبير عن الكلام واللغة.وبعبارة أخرى، يمكن العثور على المؤشرات الحيوية ذات الصلة في الصوت لفحص الأشخاص الذين يعانون من اضطرابات عقلية أو عاطفية بشكل فعال ومريح.

حضر وو مينغيو وفريقها من المعلمين والطلاب مؤتمر Interspeech 2023

بمعنى ما، عندما يتردد الناس بشأن ما إذا كانوا بحاجة إلى علاج طبي أم لا، أو كيفية الحصول عليه، يمكن أن يصبح التحليل الصوتي هو القائمة الأولى في تشخيص المرض العقلي، وإلى حد ما يضعف شعور المريض بالخجل.

طوال الوقت،وو مينغيو يصر على "إجراء البحوث العملية".بعد حصولها على درجة الدكتوراه، تلقت وو مينغيو دعوة من شركة Nuance Communications، وهي شركة متخصصة في التعرف على الكلام بالذكاء الاصطناعي، لمحاولة الانخراط في البحث التقني وتنفيذ التفاعل بين الإنسان والحاسوب في قمرة القيادة على الجانب الصناعي. وفي وقت لاحق، في محادثة مع يو كاي، أستاذ في قسم علوم الكمبيوتر والهندسة في جامعة شنغهاي جياو تونغ، رأت مزايا البحث العلمي والأفكار الجديدة لتحويل النتائج داخل الجامعات من خلال تجربة البروفيسور يو كاي، ثم عادت إلى الأوساط الأكاديمية من الصناعة.

وقال وو مينغيو بصراحة،سواء في الكليات والجامعات أو في الصناعة، فإن القصد الأصلي المتمثل في "إجراء البحوث العملية" لم يتغير أبدًا.خلال فترة الوباء، قام فريق البحث بتطوير تطبيق عملي لاستشارة الاكتئاب بناءً على الاحتياجات الفعلية، والذي يمكن للطلاب استخدامه بشكل مباشر.

إثراء تحليل الصوت والتغلب على مشاكل نقص البيانات

بعد عودته إلى الجامعة، اختار وو مينغيو اتجاه البحث في تحليل الصوت وأدرج المزيد من تقنيات الذكاء الاصطناعي فيه.في الوقت الحاضر، الاتجاه البحثي الرئيسي لمجموعة أبحاثه هو تحليل الصوت الغني، والذي يشمل بشكل عام جميع معالجة الصوت باستثناء التعرف على الكلام.

قدم وو مينغيو فكرة مفادها أن الصوت يمكن تقسيمه إلى ثلاثة مستويات:الأول هو ما يقوله الناس.هذا هو محور البحث في التعرف على الكلام؛والثاني هو كيف يتكلم الناس.وهذا يعني أن الجملة نفسها يمكن التعبير عنها بطرق مختلفة كثيرة، وبمعاني مختلفة وراءها، والتي يمكن استخدامها للكشف عن الحالة العقلية أو الوظيفة الإدراكية للشخص؛ثالثا: فهم الصوت البيئي.وهذا أيضًا هو المفتاح لجعل الآلات أشبه بالبشر في فهم الصوت. يشكل ما سبق تحليلاً صوتيًا غنيًا، ومن بين هذه التحليلات يعتبر التعرف على الكلام ناضجًا نسبيًا في الوقت الحاضر، لذا فإن تركيز بحثها ينصب على الأخيرين.

في الوقت الحالي، تضم مجموعة البحث الخاصة بـWu Mengyue أكثر من 20 طالبًا، يقومون بإجراء أبحاث ذات صلة في هذين الاتجاهين - الطب النفسي الحسابي وأبحاث الكلام المرضي في فهم الصوت.

نتائج أبحاث فريق البحث

من حيث سيناريوهات التطبيق، على سبيل المثال، في بيئة القيادة، يشير التعرف على الصوت إلى النظام التفاعلي الذي يتعرف بشكل سلبي على الأوامر وينفذ عناصر التحكم المقابلة. إذا كان التفاعل النشط ممكنًا، فمن الممكن الحكم على مزاج السائق أو تعبه بناءً على نبرة صوته، ومن الممكن تعديل الحالة المزاجية من خلال الأضواء أو المؤثرات الصوتية في السيارة. وفي الوقت نفسه، عندما تستشعر الآلة أن نبرة صوت المستخدم ليست جيدة، يمكنها أيضًا ضبط الاستراتيجية والتفكير بشكل متزامن عند الرد على التعليمات.

على سبيل المثال، أثناء الوباء، تم استخدام الميكروفونات لجمع الأصوات المحيطة بفتح وإغلاق الأبواب، وتم تحليل وتحديد حالة الشخص خارج المنزل أو في المنزل. وبالمقارنة بمراقبة الكاميرات التقليدية، فإن هذه الطريقة أكثر فائدة في حماية خصوصية الأشخاص وسلامتهم.

في الانطباع التقليدي، يجب أن تكون البيانات السليمة ذات حجم عينة كبير وأن تكون غنية للغاية، ولكن في الواقع، عندما يتعلق الأمر بتشخيص الأمراض وعلاجها، وخاصة في مجال الأمراض العقلية، تصبح البيانات تحديًا كبيرًا. من ناحية أخرى، فإن العلاقة الخاصة بين الطبيب والمريض وشعور المرضى بالخجل تجعل من الصعب للغاية الحصول على تسجيل صوتي للمحادثات الاستشارية النفسية؛ من ناحية أخرى، قد تقوم بعض المستشفيات أو الأطباء بتسجيل الاستشارات في شكل محادثات، ولكن لا يتم تشكيل أي بيانات موحدة، وغالبًا ما تكون جودة الصوت غير عالية، وبسبب حماية الخصوصية، غالبًا ما يكون من المستحيل مشاركتها مع العالم الخارجي.

تحقيقا لهذه الغاية،قاد وو مينغيو فريق البحث لبناء أول مجموعة بيانات حوار استشارية مفتوحة المصدر في العالم والتي تلبي المعايير السريرية.الخطوة الأولى هي التواصل طويل الأمد والعميق مع الأطباء والمرضى في مركز الصحة النفسية لتوحيد عملية الاستشارة ونقاط المحادثة، ومن ثم تنظيم المحتوى ذي الصلة في عملية حوار مع هيكل شجرة القرار، ومراجعته وتعديله بشكل متكرر مع الأطباء المحترفين. ثانيًا، قمنا بمحاكاة الحوارات بين الطبيب والمريض من خلال لعب الأدوار، وأخيرًا طلبنا من الأطباء المحترفين فحص البيانات التي تم الحصول عليها للحصول على بيانات أقرب إلى الاستشارات السريرية، وبالتالي تشكيل مجموعة البيانات مفتوحة المصدر هذه.

رابط مجموعة البيانات:https://x-lance.github.io/D4/

على غرار الباحثين الآخرين المشاركين في أبحاث الذكاء الاصطناعي للعلوم، فإن خلفية وو مينغيو في تقاطع علم النفس وعلوم الكمبيوتر تمكنها من معالجة نقاط الألم الفعلية للمرضى الحاليين في عملية تعزيز التشخيص والعلاج المدعوم بالذكاء الاصطناعي للأمراض العقلية، وتعديل استراتيجيات البحث بمرونة في شكل بيانات محاكاة عندما يواجه البحث تحديات. يمكن للخلفية متعددة التخصصات في كثير من الأحيان أن تؤدي إلى تحقيق اختراقات مبتكرة في مجال البحث العلمي بشكل أكثر إبداعًا.

حضر وو مينغيو مؤتمر CHINC 2022 وألقى خطابًا


بدافع الاهتمام، يمكنك تحقيق أشياء عظيمة

في المقابلة مع وو مينغيو، سمع المؤلف كلمة "الاهتمام" عدة مرات - حيث يعتمد التركيز على البحث الصوتي على الاهتمام؛ وهي مهتمة بالأبحاث المتعلقة بتشخيص الأمراض العقلية؛ إن التحول إلى قسم الكمبيوتر ليس لمواكبة الاتجاه، بل يعتمد على اهتمامها الشخصي؛ وتأمل أيضًا أن تكون مصالح الطلاب في مجموعة البحث ذات الأولوية...

لا يمكن إنكار أن "الاهتمام"، سواء كان بحثًا أكاديميًا صارمًا أو عملًا سريعًا في مكان العمل، هو بمثابة قطعة من التربة تحتوي على المزيد من العناصر الغذائية. إذا تم زرعها في مرحلة الطفولة، فإن القوة الدافعة للنمو نحو الأعلى ستكون أقوى. في حين أن الأستاذة وو مينغيو تعتمد على اهتماماتها، إلا أنها لا تتكاسل على الرغم من كونها "بوذية". سواء كان الأمر يتعلق بتراكم البحث العلمي في وتيرة نشر الأوراق أو التطبيق العملي لتكامل الصناعة والبحث، فهي كلها دليل قوي على ممارستها لـ "إجراء البحوث العملية".

في السنوات الأخيرة، أصبحت المزيد والمزيد من القوى النسائية نشطة في مجالات العلوم والتكنولوجيا والبحث العلمي، وجلبت ابتكارات ثورية أذهلت العالم. وقد اختار صندوق الأمم المتحدة للمرأة هذا العام أيضا موضوع اليوم العالمي للمرأة تحت عنوان "الاستثمار في المرأة: تسريع التقدم"، وهو ما يسلط الضوء إلى حد ما على الدور المهم الذي تلعبه المرأة في العملية الاجتماعية.

ورغم أن المؤلف لا يريد التركيز كثيراً على الاختلافات بين الجنسين، إلا أن الضغوط موجودة في البيئة الاجتماعية الحقيقية. ولكن كما قال وو مينغيو، "ركز على السعادة وابدأ من اهتماماتك". وخاصة عندما لا يفرض العالم الخارجي توقعات عالية للغاية على النساء، فهذا يعني في الواقع أنه لا يوجد الكثير من القيود. ربما يوفر مساحة للنمو لتجميع القوة والانفجار عندما تنشأ الفرصة.

وأخيرًا، في هذا اليوم المميز، أتمنى أن تتمكن جميع النساء من أن يصبحن مثل المعلمة وو مينغيو، وأن ينمون في اهتماماتهن، ويمتصن العناصر الغذائية بثقة، ويعشن حياة أكثر روعة وحرية!