نموذج أساسي متعدد الوسائط جزيئي يربط بين الرسوم البيانية للجزيئات واللغة الطبيعية

رغم التقدم الملحوظ الذي أحرزته الذكاء الاصطناعي (AI) في فهم الجزيئات في مجالات متنوعة، فإن النماذج الحالية تكتسب غالبًا قدرة معرفية واحدة من وضعية جزيئية واحدة. نظرًا لعمق هرم المعرفة الجزيئية، يتعلم البشر أيضًا من وضعيات مختلفة تشمل الرسومات الحدسية والنصوص المهنية لمساعدتهم على الفهم. مستوحىً من هذا، نقترح نموذجًا أساسيًا متعدد الوضعيات للجزيئات يتم تدريبه من الرسوم البيانية للجزيئات ومن البيانات النصية ذات الصلة معانيًا (المستخرجة من أوراق بحثية منشورة في مؤشر الاستشهادات العلمية) عبر التعلم التضادي. يمثل هذا النموذج الذكاء الاصطناعي محاولة حاسمة تربط مباشرة بين الرسوم البيانية للجزيئات واللغة الطبيعية. وبشكل مهم، من خلال التقاط المعلومات الخاصة والمكملة للوضعيتين، يمكن لنموذجنا المقترح أن يفهم بشكل أفضل الخبرة الجزيئية. تظهر النتائج التجريبية أن نموذجنا ليس فقط يقدم أداءً واعدًا في المهام المتعددة الوضعيات مثل استرجاع البيانات العابرة للوضعيات ووصف الجزيء، بل إنه يعزز أيضًا التنبؤ بالخصائص الجزيئية ويملك القدرة على إنشاء رسوم بيانية جزيئية ذات معنى من الوصف باللغة الطبيعية. نعتقد أن نموذجنا سيترك أثرًا واسعًا في المجالات التي تعتمد على الذكاء الاصطناعي عبر مختلف التخصصات مثل علم الأحياء والكيمياء وهندسة المواد والبيئة والطب وغيرها.