ChemDFM-R: منهجية مُحكَمة للReasoning الكيميائي تعززت بمعارف كيميائية مُجزَّأة

على الرغم من التقدم الملحوظ الذي حققته النماذج اللغوية الكبيرة (LLMs)، تظل تطبيقاتها في المجالات العلمية مثل الكيمياء محدودة بسبب ضعف الفهم المتعلق بالقطاع وحدود القدرات الاستدلالية. في هذا العمل، نركّز على المجال المحدد للكيمياء ونطوّر نموذجًا لغويًا كبيرًا يُسمّى ChemDFM-R، مُخصصًا للReasoning الكيميائي. أولاً، نُنشئ مجموعة بيانات شاملة من نقاط المعرفة المُفكّكة لتعزيز فهم النموذج للمبادئ الأساسية والهيكل المنطقي للكيمياء. ثم نقترح استراتيجية تَشْتِيت مُختلطة المصادر، تدمج بين المعرفة التي قام بها خبراء ومهارات الاستدلال العامة في المجالات الواسعة، تليها عملية تعلم التقوية المُخصصة للقطاع لتعزيز القدرة على الاستدلال الكيميائي. أظهرت التجارب على معايير كيميائية متنوعة أن نموذج ChemDFM-R يحقق أداءً متقدماً في مستوى الحد الأقصى، مع تقديم نتائج قابلة للتفسير وتعتمد على سلسلة من الأسباب المنطقية. كما تُظهر الدراسات الحالة الإضافية كيف أن سلاسل الاستدلال الصريحة تُحسّن بشكل كبير موثوقية النموذج وشفافيته وقيمة استخدامه العملي في سيناريوهات التعاون الفعلي بين الإنسان والذكاء الاصطناعي.