توحيد التمثيلات الجزيئية والنصية من خلال نماذج اللغة متعددة المهام

التطورات الحديثة في نماذج اللغة العصبية تم تطبيقها بنجاح أيضًا في مجال الكيمياء، مما قدم حلولًا إبداعية لمشكلات كلاسيكية في تصميم الجزيئات وخطّة التركيب. هذه الطرق الجديدة لديها القدرة على دفع عصر جديد من الأتمتة القائمة على البيانات في اكتشاف العلم. ومع ذلك، لا يزال من الضروري استخدام نماذج متخصصة لكل مهمة، مما يؤدي إلى الحاجة للضبط الدقيق المحدد للمشكلة وإهمال العلاقات بين المهام. العقبة الرئيسية في هذا المجال هي نقص التمثيل الموحد بين اللغة الطبيعية والتمثيلات الكيميائية، مما يعقد ويحد من التفاعل بين الإنسان والآلة. هنا، نقترح أول نموذج لغوي متعدد المجالات والمهام يمكنه حل مجموعة واسعة من المهام في كلٍ من المجالات الكيميائية واللغوية الطبيعية. يمكن لنموذجنا التعامل مع اللغة الكيميائية واللغة الطبيعية بشكل متزامن، دون الحاجة إلى التدريب المسبق الغالي الثمن على مجالات واحدة أو نماذج محددة للمهمة. وبشكل مثير للاهتمام، فإن مشاركة الأوزان عبر المجالات تحسّن بشكل كبير أداء نموذجنا عند مقارنته بالأسس الرائدة حاليًا في المهام ضمن مجال واحد وفي المهام عبر المجالات. وبالأخص، فإن مشاركة المعلومات عبر المجالات والمهام تؤدي إلى تحسينات كبيرة في المهام عبر المجالات، حيث يزداد حجم هذه التحسينات مع زيادة الحجم، كما تقاس بأكثر من عشرة مقاييس ذات صلة. يشير عملنا إلى أن مثل هذه النماذج يمكن أن تسريع الاكتشاف في العلوم الفيزيائية بشكل ثابت وكفء عن طريق استبدال الضبط الدقيق المحدد للمشكلة وتعزيز التفاعلات بين الإنسان والنموذج.