UniGeo: توحيد الاستدلال المنطقي الهندسي من خلال إعادة صياغة التعبيرات الرياضية

حل المشكلات الهندسية هو اختبار معترف به على نطاق واسع لتقييم قدرة النماذج العميقة على الاستدلال متعدد الأوضاع بمستوى عالٍ. في معظم الأعمال الحالية، يتم التعامل مع مشكلتين رئيسيتين في الهندسة: الحساب والبرهنة، كمهمتين محددتين، مما يعيق توحيد قدرة النموذج العميق على الاستدلال في مهام الرياضيات المتعددة. ومع ذلك، في جوهرها، تمتلك هاتان المهمتان تمثيلات مشكلة متشابهة ومعرفة رياضية متداخلة يمكن أن تحسن فهم واستدلال النموذج العميق في كلتا المهمتين. لذلك، قمنا ببناء مقاييس هندسية موحدة على نطاق كبير، تُسمى UniGeo، والتي تحتوي على 4,998 مشكلة حسابية و9,543 مشكلة برهانية. تم توثيق كل مشكلة برهانية بمجموعة من الخطوات البرهانية التي تتضمن الأسباب والتعبيرات الرياضية. يمكن إعادة صياغة البرهان بسهولة كسلسلة برهان تشترك في نفس التنسيقات مع سلسلة البرنامج الموثقة للمشكلات الحسابية. بشكل طبيعي، نقدم أيضًا إطار جيوفرمر (Geoformer) متعدد المهام والموحد للتعامل مع المشكلات الحسابية والبرهانية بشكل متزامن من خلال توليد السلسلة، والذي يظهر في النهاية أن قدرة الاستدلال يمكن تحسينها في كلتا المهمتين من خلال التوحيد الصيغوي. بالإضافة إلى ذلك، اقترحنا طريقة التعلم الأولي للتعبيرات الرياضية (MEP) التي تستهدف التنبؤ بالتعبيرات الرياضية في حل المشكلة، وبالتالي تحسين نموذج الجيوفرمر (Geoformer). أثبتت التجارب على UniGeo أن الجيوفرمر (Geoformer) المقترح لدينا حقق أفضل الأداء الحالي عن طريق تفوقه على نموذج NGS المحدد للمهمة بنسبة دقة تزيد عن 5.6% و3.2% لكل من المشكلات الحسابية والبرهانية على التوالي.