HyperAI

سكتة دماغية جعلتها عاجزة عن الكلام لمدة 18 عامًا، والذكاء الاصطناعي وواجهة الدماغ والحاسوب تساعدها على "التحدث بأفكار"

特色图像

لقد قال زويج ذات مرة:أعظم حظ في حياة الإنسان أن يكتشف رسالته في منتصف حياته، عندما يكون شاباً وقوياً.

وما أعظم مصيبة الإنسان؟

في رأيي أن أعظم مصيبة في حياة الإنسان هيلا يوجد شيء أسوأ من فقدان القدرة على الكلام والحركة فجأة في ذروة الحياة.- بين عشية وضحاها، تحولت الأحلام والوظائف والأمنيات إلى لا شيء، وانقلبت الحياة رأسًا على عقب.

آن هي مثال مؤسف.

30 عامًا، فقدان القدرة على الكلام بسبب السكتة الدماغية

في أحد الأيام من عام 2005، أصيبت آن، التي كانت تتمتع بصحة جيدة دائمًا، فجأة بالدوار، واضطراب الكلام، والشلل الرباعي، وضعف العضلات. لقد تم تشخيصها بـاحتشاء جذع الدماغ(ما نسميه "السكتة الدماغية" في الحياة اليومية)،يصاحب ذلك تشريح الشريان الفقري الأيسر وانسداد الشريان القاعدي.

جلبت هذه السكتة الدماغية غير المتوقعة لآنمتلازمة الحبسأحد النتائج الثانوية لهذا المرض هو أن الأشخاص المصابين بهذا المرض لديهم كل حواسهم ووعيهم، ولكنهم لا يستطيعون تحريك أي عضلة في الجسم. لا يستطيع المرضى التحرك أو التحدث بشكل مستقل، وبعضهم لا يستطيع حتى التنفس.

وكما تعكس كلمة "مقفل" حرفيًا، فإن الجسد الذي يحمل الناس العاديين عبر آلاف الجبال والأنهار أصبح قفصًا يغلق على روح المريض.

في ذلك الوقت، كانت آن تبلغ من العمر 30 عامًا فقط، وكانت متزوجة منذ عامين وشهرين، وكانت ابنتها تبلغ من العمر 13 شهرًا فقط، وكانت معلمة رياضيات في مدرسة ثانوية في كندا. "لقد تم أخذ كل شيء مني بين عشية وضحاها." استخدمت آن لاحقًا الجهاز لكتابة هذه الجملة ببطء على الكمبيوتر.

آن، التي شاركت في الدراسة

بعد سنوات من العلاج الطبيعي، أصبحت آن قادرة على التنفس، وتحريك رأسها قليلاً، ورمش عينيها، والتحدث ببضع كلمات، ولكن هذا كان كل شيء.

يجب أن تعلم أن سرعة التحدث لدى الشخص العادي في الحياة العادية هي 160-200 كلمة/دقيقةفي عام 2007، أظهرت دراسة من قسم علم النفس بجامعة أريزونا أن الرجال يقولون في المتوسط 15,669 الكلمات التي تقولها النساء في المتوسط 16,215 الكلمات (في المتوسط، تقابل الكلمة الواحدة 1.5-2 حرفًا صينيًا).

في عالم حيث اللغة هي الوسيلة الأساسية للتواصل بين الأشخاص، يمكننا أن نتخيل عدد احتياجات آن، بسبب قدرتها المحدودة على التعبير، التي تم إسكاتها.ما نفقده بسبب فقدان القدرة على الكلام ليس فقط نوعية الحياة، بل أيضًا الشخصية والهوية.وكم عدد الأشخاص المشلولين والفاقدين للقدرة على الكلام حول العالم الذين يعانون من نفس وضع آن؟

بعد أن أصيب بالشلل لمدة 18 عامًا، يتحدث مرة أخرى

إن استعادة القدرة على التواصل بشكل كامل وطبيعي هي أعظم رغبة لدى كل شخص فقد قدرته على الكلام بسبب الشلل.في عالمنا التكنولوجي المتطور للغاية اليوم، هل هناك أي طريقة لاستخدام قوة التكنولوجيا لاستعادة قدرة التواصل الشخصي للمرضى؟

يملك!

في الآونة الأخيرة، قام فريق بحثي من جامعة كاليفورنيا، سان فرانسيسكو وجامعة كاليفورنيا، بيركلياستخدام الذكاء الاصطناعي لتطوير تقنية جديدة للدماغ والحاسوبآن، التي كانت عاجزة عن الكلام لمدة 18 عامًا، استعادت قدرتها على الكلام. "يتكلم"، وتوليد حيويةتعابير الوجه، مما يساعد المرضى على التواصل مع الآخرين في الوقت الحقيقي بسرعة وجودة تتفق مع التفاعل الاجتماعي الطبيعي.

تستخدم آن صورة رمزية رقمية للتحدث إلى الأشخاص

هذه هي المرة الأولى في تاريخ البشرية التي يتم فيها تصنيع الكلام وتعبيرات الوجه من إشارات الدماغ!

وأظهرت الأبحاث السابقة التي أجراها فريق جامعة كاليفورنيا أنه من الممكن فك شفرة اللغة من خلال نشاط الدماغ لدى الأشخاص المصابين بالشلل، ولكن فقط في شكل نص مكتوب، وبسرعة ومفردات محدودة.

هذه المرة يريدون الذهاب إلى خطوة أبعد:إنه يتيح التواصل بشكل أسرع مع النصوص ذات المفردات الكبيرة مع استعادة الكلام وحركات الوجه المرتبطة بالتحدث.

وبناءً على تقنية التعلم الآلي وواجهة الدماغ والحاسوب، توصل فريق البحث إلى النتائج التالية، والتي نُشرت في مجلة Nature في 23 أغسطس 2023:

► لنص، فك تشفير إشارات دماغ الأشخاص إلى نص بمعدل 78 كلمة في الدقيقة، مع معدل خطأ في الكلمات يبلغ متوسطه 25%، وهو أسرع بأربع مرات من جهاز الاتصال الذي يستخدمه المشاركون حاليًا (14 كلمة/دقيقة)؛

►لـصوت صوتي، تجميع إشارات الدماغ بسرعة إلى أصوات مفهومة وشخصية تتوافق مع صوت الشخص قبل الإصابة؛

►لـالصورة الرمزية للوجه الرقمية، تحقيق التحكم الافتراضي في حركة الوجه لإيماءات التواصل الكلامية وغير الكلامية.

رابط الورقة:

https://www.nature.com/articles/s41586-023-06443-4

لا بد أنك فضولي.كيف تحققت هذه المعجزة التاريخية؟والآن، دعونا نحلل هذه الورقة بالتفصيل ونرى كيف نجح الباحثون في إعادة الفيروس إلى الحياة.

1. المنطق الأساسي إشارات الدماغ → الكلام + تعبيرات الوجه

يقوم الدماغ البشري بإخراج المعلومات من خلال الأعصاب الطرفية والأنسجة العضلية، في حين يتم توليد القدرة اللغوية من خلال القشرة المخية. "مركز اللغة"مُسيطر عليه.

السبب الذي يجعل مرضى السكتة الدماغية يعانون من فقدان القدرة على الكلام هو انسداد الدورة الدموية وتضرر منطقة اللغة في الدماغ بسبب نقص الأكسجين والعناصر الغذائية المهمة، مما يؤدي إلى عدم قدرة آلية أو أكثر من آليات التواصل اللغوي على العمل بشكل صحيح، مما يؤدي إلى خلل في اللغة.

ردًا على ذلك، قام فريق بحثي من جامعة كاليفورنيا وسان فرانسيسكو وبيركلي بتصميم "طرف اصطناعي عصبي متعدد الوسائط للكلام"، باستخدام مخطط كهربية الدماغ القشري عالي الكثافة وواسع النطاق لفك تشفير النص ومخرجات الكلام السمعي البصري التي يمثلها المسار الصوتي الموزع في جميع أنحاء القشرة الحسية (SMC)، أي التقاط إشارات الدماغ في المصدر و"ترجمتها" إلى نص وكلام وحتى تعبيرات وجهية مقابلة من خلال وسائل تقنية.

فك تشفير الكلام متعدد الوسائط لدى المرضى الذين يعانون من شلل المسالك الصوتية

2. العملية والتنفيذ واجهة الدماغ والحاسوب + خوارزمية الذكاء الاصطناعي

الأول هو الوسائل المادية.

قام الباحثون بزراعةمجموعة تخطيط كهربية الدماغ عالية الكثافةوموصل الإرساء عبر الجلد، والتي تغطي المجالات المتعلقة بإنتاج الكلام وإدراك الكلام.

تتكون المصفوفة من 253يتم استخدام الأقطاب الكهربائية ذات الشكل القرصي لاعتراض إشارات الدماغ التي يتم إرسالها في الأصل إلى لسان آن وفكها وحلقها وعضلات وجهها. يتم توصيل كابل بمنفذ مثبت في رأس آن، مما يربط الأقطاب الكهربائية بمجموعة من أجهزة الكمبيوتر.

تم زرع مجموعة الأقطاب الكهربائية في منطقة التحكم باللغة على سطح القشرة المخية للموضوع.

الثاني هو بناء الخوارزمية.

لتحديد إشارات الكلام الفريدة في دماغ آن،عمل فريق البحث معها لعدة أسابيع لتدريب وتقييم نموذج التعلم العميق.

قام الباحثون بإنشاء مجموعة مكونة من 1024 جملة شائعة استنادًا إلى مجموعة تويتر nltk ومجموعة أفلام Cornell، حيث طلبوا من آن التحدث بصمت بمعدل حديث طبيعي. تكرر مرارا وتكرارا عبارات مختلفة من مفردات المحادثة التي يبلغ عددها 1024 كلمة.حتى يتمكن الكمبيوتر من التعرف على أنماط نشاط الدماغ المرتبطة بتلك الأصوات.

ومن الجدير بالذكر أن هذا النموذج لا يقوم بتدريب الذكاء الاصطناعي على التعرف على الكلمات بأكملها.وبدلا من ذلك، تم إنشاء نظامفك تشفير الكلمات من الصوتياتعلى سبيل المثال، تحتوي كلمة "Hello" على أربعة أصوات: "HH"، "AH"، "L" و"OW".

وبناءً على هذه الطريقة، يحتاج الكمبيوتر فقط إلى تعلم 39 صوتًا لفك شفرة أي كلمة إنجليزية.فهو لا يحسن الدقة فحسب، بل يزيد السرعة أيضًا بمقدار 3 مرات.

ملاحظة: الفونيم هو أصغر وحدة صوتية في اللغة، والتي يمكنها وصف خصائص نطق الكلام، بما في ذلك مكان النطق، وطريقة النطق، واهتزاز الحبال الصوتية. على سبيل المثال، تتكون فونيمات الكلمة an من /ə/ و/n/.

إن عملية فك تشفير الأصوات تشبه عملية تعلم الطفل التحدث. بحسب النظرة المقبولة عموماً في مجال اللغويات التنموية، فإن الأطفال حديثي الولادة قادرون على التمييز بين اللغات المختلفة في العالم. 800 فردصوت. قد لا يفهم أطفال ما قبل المدرسة كتابة ومعنى الكلمات والجمل، ولكنهم يستطيعون تدريجيًا تعلم النطق وفهم اللغة من خلال إدراك الأصوات وتمييزها وتقليدها.

وأخيرًا، هناك تركيب الكلام وتعبيرات الوجه.

لقد تم وضع الأساس، والخطوة التالية هي إظهار الصوت وتعابير الوجه.الباحثونتركيب الكلاموالصورة الرمزية الرقميةلحل هذه المشكلة.

صوتقام الباحثون بتطوير خوارزمية كلام اصطناعي باستخدام تسجيلات صوت آن قبل إصابتها بالسكتة الدماغية لجعل الصورة الرمزية الرقمية تبدو مثلها قدر الإمكان.

تعابير الوجهتم إنشاء الصورة الرمزية الرقمية لـ Ann باستخدام برنامج تم تطويره بواسطة Speech Graphics ويظهر كرسوم متحركة لوجه أنثوي على الشاشة.

قام الباحثون بتخصيص عملية التعلم الآلي.لضبط البرنامج على الإشارات التي يرسلها دماغ آن عندما تحاول التحدث، مما يظهر الفك وهو يفتح ويغلق، والشفاه وهي تبرز وتتراجع، واللسان وهو يتحرك لأعلى ولأسفل، وحركات الوجه والإيماءات التي تعبر عن السعادة والحزن والمفاجأة.

تعمل آن مع الباحثين على تدريب الخوارزميات

النظرة المستقبلية

قال الدكتور إدوارد تشانج، رئيس قسم جراحة الأعصاب بجامعة كاليفورنيا في سان فرانسيسكو: "هدفنا هو استعادة شكل كامل وملموس من التواصل".، وهي الطريقة الأكثر طبيعية بالنسبة لنا للتحدث مع الآخرين... إن هدف الجمع بين الكلام المسموع والصور الرمزية في الحياة الواقعية يسمح بالتجلي الكامل للتواصل اللغوي البشري، والذي هو أكثر بكثير من مجرد لغة.

الخطوة التالية لفريق البحث هيإنشاء نسخة لاسلكية،التخلص من الاتصال المادي بين واجهات الدماغ والحاسوب، مما يتيح للأشخاص المصابين بالشلل استخدام هذه التكنولوجيا للتحكم بحرية في هواتفهم المحمولة وأجهزة الكمبيوتر الشخصية، وهو ما سيكون له تأثير عميق على استقلاليتهم وتفاعلهم الاجتماعي.

من المساعدين الصوتيين على الهواتف المحمولة، إلى الدفع الإلكتروني من خلال مسح الوجه، إلى الأذرع الروبوتية في المصانع وفرز الروبوتات على خطوط الإنتاج،يعمل الذكاء الاصطناعي على توسيع أطراف الإنسان وحواسه، ويتغلغل تدريجيا في كل جانب من جوانب إنتاجنا وحياتنا.

يركز الباحثون على مجموعة خاصة من الأشخاص المصابين بالشلل وفقدان القدرة على الكلام، باستخدام قوة الذكاء الاصطناعي لمساعدتهم على استعادة قدرتهم الطبيعية على التواصل، ومن المتوقع أن يعزز هذا التواصل بين المرضى وأقاربهم وأصدقائهم، ويوسع فرصهم لاستعادة التفاعل الشخصي.وأخيراجودة حياة عالية للمريض.

نحن متحمسون لهذا الإنجاز ونتطلع إلى سماع المزيد من الأخبار الجيدة حول كيفية استفادة البشرية من الذكاء الاصطناعي.

روابط مرجعية:

[1] https://www.sciencedaily.com/releases/2023/08/230823122530.htm

[2] http://mrw.so/6nWwSB