HyperAI

جوجل تطور الذكاء الاصطناعي للتعرف على الروائح بالاعتماد على GNN، وهو ما يعادل 70 عامًا من العمل المتواصل من قبل المقيمين البشريين

منذ 2 أعوام
معلومة
Xuran Zhang
特色图像

المحتويات في لمحة:الروائح موجودة دائما حولنا. ومع ذلك، فمن الصعب بالنسبة لنا أن نصف الروائح بدقة. مؤخرًا، قامت شركة Osmo، وهي شركة تابعة لشركة Google Research، بتطوير الذكاء الاصطناعي لتحليل الروائح استنادًا إلى الشبكات العصبية الرسومية. يمكنه التنبؤ برائحة الجزيئات الكيميائية بناءً على بنيتها. وبناءً على هذا الذكاء الاصطناعي، رسم الباحثون خريطة الطيف الرئيسي للرائحة وأنشأوا خريطة بين التركيب الكيميائي والرائحة، وهو ما من المتوقع أن يوفر طريقة جديدة للبحث الإدراكي.

الكلمات المفتاحية:تحليل الرائحة باستخدام طيف الروائح GNN

المؤلف | شيويه تساي

المحرر | سانيانغ

تم نشر هذه المقالة لأول مرة على منصة HyperAI WeChat العامة~

إن إحدى المشكلات الأساسية في أبحاث علم الأعصاب هي رسم خرائط الخصائص الفيزيائية للمحفزات الخارجية في الإدراكات الحسية.

في الرؤية، اللون هو رسم لطول الموجة. في السمع، يعتبر النغمة عبارة عن تعيين للتردد.ولكن في حاسة الشم، من الصعب إقامة علاقة بين الروائح والمواد.

في الوقت الحالي، لا يمكننا إلا استخراج بعض الروائح الأساسية، ورسم عجلة العطور، ثم استخدام هذه الروائح الأساسية لتشكيل روائح أكثر تعقيدًا.

الشكل 1: مخطط تخطيطي لعجلة الرائحة

ومع ذلك، فمن الصعب استخدام هذا التصنيف التقريبي في البحث العلمي. على الرغم من أن التقنيات مثل أجهزة استشعار الروائح متاحة بالفعل لمراقبة الروائح، إلا أن هذه الأجهزة لا تزال قادرة على تحديد روائح محددة فقط.في كثير من الأحيان، لا تزال عملية تحديد الروائح الحالية تتطلب مشاركة خبراء تقييم الروائح، وهي عملية تستغرق وقتًا طويلاً ولا يمكن تكرارها بشكل جيد.

مؤخرًا، قامت شركة Osmo، وهي فرع من Google Research، بتطوير الذكاء الاصطناعي لتحليل الروائح استنادًا إلى الشبكات العصبية الرسومية (GNN).يمكنه وصف رائحة جزيء كيميائي بناءً على بنيته.يتفوق هذا النموذج على البشر في الحكم على 53% من الجزيئات الكيميائية و 55% من أوصاف الرائحة.وأخيرا، استخدم الباحثون هذا النموذج لرسم خريطة طيف الرائحة الرئيسية (POM) (خريطة الرائحة الأساسية).وقد نشرت هذه النتيجة في مجلة Science.

وقد تم نشر أبحاث ذات صلة في مجلة العلوم

رابط الورقة:

https://www.science.org/doi/full/10.1126/science.ade4401

الإجراءات التجريبية

نماذج GNN مستقرة عبر هياكل معمارية متعددة

الرائحة هي في الأساس إدراك الناس للجزيئات الكيميائية الموجودة في الهواء.ولذلك فإن بنية الجزيئات الكيميائية تؤثر على الرائحة.في GNN، يتم تحليل بنية الجزيئات الكيميائية ودمجها لتشكيل رسم بياني يمثل الجزيء بأكمله.

بعد إدخال البنية الجزيئية في النموذج،تعمل GNN على تحسين أوزان الهياكل الكيميائية المختلفة في رائحة معينةوأخيرًا، يتم الحكم على رائحة الجزيء من خلال طبقة التنبؤ ويتم إخراج كلمة وصف الرائحة المقابلة.

الشكل 2: مخطط تخطيطي لنموذج GNN

من خلال الجمع بين قواعد بيانات Good Scents وLeffingwell & Associates (قواعد بيانات GS-LF)،وقد اختار الباحثون 5000 جزيء كقاعدة بيانات للنموذج.يمكن وصف كل جزيء برائحة متعددة، مثل رائحة الجبن والفواكه وما إلى ذلك.

الشكل 3: بعض الجزيئات في قاعدة بيانات GS-LF

وبعد ذلك، تم تقسيم قاعدة بيانات GS-LF إلى مجموعات تدريب واختبار بنسبة 8:2، وتم تقسيم مجموعة التدريب إلى خمس مجموعات فرعية للتحقق المتبادل.

تم استخدام خوارزمية التحسين البايزية للتحقق المتبادل من البيانات وتحسين المعلمات الفائقة لنموذج GNN.بعد التحسين، أظهر نموذج GNN أداءً مستقرًا في هياكل متعددة، مع وصول أعلى قيمة AUROC إلى 0.89 في مجموعة التحقق المتبادل.

تتفوق نماذج GNN على البشر في التنبؤ بالرائحة

وللتحقق من قدرة النموذج على التمييز بين الجزيئات الأخرى، أجرى الباحثون اختبارات الرائحة على نموذج GNN ومجموعة بشرية.

الشكل 4: الحكم على رائحة 2،3- ثنائي هيدرو بنزوفيوران-5- كاربوكسالدهيد بواسطة نماذج مختلفة

أ: نموذج GNN؛

ب: نموذج RF؛

ج: مجموعة بشرية؛

د: تقييم رائحة 2،3- ثنائي هيدرو بنزوفيوران-5- كاربالديهيد من قبل مقيمين مختلفين.

بالنسبة للجزيء 53%، كانت نتائج التنبؤ بالرائحة لنموذج GNN أفضل من المتوسط للمجموعة البشرية.لقد تفوقت الخوارزمية الأكثر تقدمًا، نموذج الغابة العشوائية (RF) المستند إلى بصمة الإصبع القائمة على العد (cFP)، على المجموعة البشرية فقط في التنبؤ بالرائحة الجزيئية لـ 41%.

الشكل 5: ارتباط التنبؤات من نماذج مختلفة بمتوسط المجموعة البشرية

قام الباحثون بعد ذلك بتصنيف تنبؤات نموذج GNN إلى أوصاف للرائحة. باستثناء المسك، فإن نتائج التنبؤ بنموذج GNN للروائح الجزيئية تقع جميعها ضمن توزيع الخطأ للمجموعة البشرية.ويتفوق على متوسط المجموعة البشرية في نتائج التنبؤ بـ 30 وصفًا للرائحة.

الشكل 6:نتائج الحكم على نموذج GNN ونموذج RF والمجموعة البشرية على جزيئات مختلفة

تتأثر نتائج التنبؤ بنموذج GNN ببنية الجزيءلذلك، بالنسبة لرائحة الثوم المحتوي على الكبريت ورائحة السمك التي تحتوي على الأمين، يتمتع نموذج GNN بدقة تنبؤ أعلى. يحتوي المسك على خمسة هياكل مختلفة على الأقل: حلقية كبيرة، ومتعددة الحلقات، ونيترو، وستيرويدية، وخطية، وبالتالي فإن نتائج التنبؤ بنموذج GNN هي الأسوأ.

تأثر أداء المجموعة البشرية بالألفة.وكانوا أكثر اتساقًا في أحكامهم على روائح الأطعمة الشائعة مثل المكسرات والثوم والجبن، ولكن كانت هناك اختلافات أكبر في أحكامهم على المسك والقش.

في الوقت نفسه، سيؤثر عدد الوصافات في مجموعة التدريب أيضًا على تنبؤ نموذج GNN برائحة معينة.عندما يكون عدد الحالات مرتفعًا بدرجة كافية، يمكن لنموذج GNN إجراء تنبؤات دقيقة نسبيًا للهياكل المعقدة، مثل النكهات الفاكهية والزهرية والحلوة.

الشكل 7: تأثير بيانات التدريب على الارتباط بين نتائج التنبؤ بنموذج GNN ومتوسط المجموعة البشرية

لكن،بالنسبة للنكهات التي تظهر بشكل أقل تكرارًا، تكون دقة نموذج GNN مستقطبة.كانت دقة التنبؤ برائحة السمك والنعناع والكافور عالية، لكن الحكم على الأوزون وحمض الخليك وطعم المخمر كان ضعيفا.

يرسم نموذج GNN طيف الرائحة الرئيسي

بعد التحقق من أداء نموذج GNN، استخدمه الباحثون بشكل أكبر في مهام شمية مختلفة.

أولاً، قاموا باختبار قدرة النموذج على تحديد الجزيئات ذات البنية المتشابهة.بمجرد أن يتعرف النموذج على رائحة الجزيء، فإنه يحتاج إلى الحكم على روائح الجزيئات ذات الهياكل المتشابهة ولكن الروائح المختلفة والجزيئات ذات الهياكل المختلفة ولكن الروائح المتشابهة.بالنسبة لهذه العلاقة غير الطبيعية بين البنية والرائحة، فإن نموذج GNN لديه دقة حكم تبلغ 50%، في حين أن نموذج RF لديه 19% فقط.

الشكل 8: مجموعة من الثلاثيات التي تكون بنيتها أو روائحها قريبة من الجزيئات المعروفة

بعد الحصول على علاقة مستقرة بين البنية والرائحة، بدأ الباحثون في محاولة رسم طيف واسع النطاق للرائحة.لقد أكملوا خريطة الرائحة الأولية (POM) لحوالي 500000 جزيء.لا تزال هذه الجزيئات غير معروفة في المجال العلمي، ومعظمها لم يتم تصنيعه بعد.

ومع ذلك، يمكن حساب مواقعها في الطيف بشكل مباشر بواسطة نموذج GNN، وبالتالي يمكن رسم طيف رائحة واسع النطاق.ولو تمكن إنسان مدرب من تقييم رائحة هذه الجزيئات، فسوف يستغرق الأمر حوالي 70 عاماً من العمل المتواصل.

الشكل 9: طيف الرائحة الرئيسي

في الشكل، يتم تحديد إحداثيات كل رائحة جزيئية بواسطة نموذج GNN، وتتوافق قيمة RGB للون الخاص بها مع إحداثيات الأبعاد الثلاثة الأولى في مصفوفة الرائحة المتوقعة.

تأثير بروست: العلاقة بين الشم والذاكرة

عندما نشم رائحة معينة، فإنها تذكرنا بذكريات الماضي، والرائحة تجعل تلك الذكرى أكثر وضوحا وعاطفية.في رواية "البحث عن الزمن المفقود"، يلاحظ الكاتب مارسيل بروست أنه عندما يشم الراوي رائحة المادلين المنقوعة في الشاي، "يعود إليه الماضي". ولذلك تسمى هذه الظاهرة أيضًا بتأثير بروست.

ترتبط حاسة الشم بالذاكرة في الجهاز العصبي بشكل وثيق أكثر من أي حاسة أخرى.إنه النظام الحسي الوحيد الذي يرتبط بشكل مباشر بالمناطق العاطفية والذاكرة في الدماغ.عندما يتم تنشيط الخلايا الشمية، تنتقل النبضات العصبية مباشرة إلى قشرة العضلة الكمثرية. تتضمن هذه المنطقة من الدماغ اللوزة الدماغية، المسؤولة عن الخوف والعواطف الأخرى، والتلفيف المجاور للحصين، المسؤول عن الذاكرة.

الشكل 10: مكونات الدائرة الشمية

القشرة الشمية الأولية: القشرة الشمية الأولية؛

اللوزة: اللوزة؛

الحُصين: فرس البحر.

وبما أن حاسة الشم ترتبط ارتباطًا وثيقًا بالذاكرة والعاطفة، فقد أصبح العطر أمرًا ضروريًا للناس عندما يخرجون ويلتقون بالناس. ربما لا يستطيع الشخص الآخر أن ينادي اسمك عندما يراك مرة أخرى، ولكن عندما يشم هذه الرائحة، فإنه بالتأكيد سوف يتذكر المشهد الذي التقى بك فيه.

بمساعدة الذكاء الاصطناعي، أصبح لدى الناس فهم أعمق للعلاقة بين البنية الجزيئية والرائحة.ربما في يوم من الأيام، سنكون قادرين حقًا على مزج النكهة التي نعرفها جيدًا. افتح غطاء الزجاجة ويمكنك أن تأخذ آلة الزمن وتعود إلى الماضي.

روابط مرجعية:

[1] https://perfumersupplyhouse.com/2014/01/09/fragrance-creation-wheels-for-you/

[2] https://www.slideserve.com/cora-schroeder/functional-neuroanatomy

تم نشر هذه المقالة لأول مرة على منصة HyperAI WeChat العامة~