HyperAIHyperAI

Command Palette

Search for a command to run...

UniGeo: توحيد الاستدلال المنطقي الهندسي من خلال إعادة صياغة التعبيرات الرياضية

Jiaqi Chen Tong Li Jinghui Qin Pan Lu Liang Lin Chongyu Chen Xiaodan Liang

الملخص

حل المشكلات الهندسية هو اختبار معترف به على نطاق واسع لتقييم قدرة النماذج العميقة على الاستدلال متعدد الأوضاع بمستوى عالٍ. في معظم الأعمال الحالية، يتم التعامل مع مشكلتين رئيسيتين في الهندسة: الحساب والبرهنة، كمهمتين محددتين، مما يعيق توحيد قدرة النموذج العميق على الاستدلال في مهام الرياضيات المتعددة. ومع ذلك، في جوهرها، تمتلك هاتان المهمتان تمثيلات مشكلة متشابهة ومعرفة رياضية متداخلة يمكن أن تحسن فهم واستدلال النموذج العميق في كلتا المهمتين. لذلك، قمنا ببناء مقاييس هندسية موحدة على نطاق كبير، تُسمى UniGeo، والتي تحتوي على 4,998 مشكلة حسابية و9,543 مشكلة برهانية. تم توثيق كل مشكلة برهانية بمجموعة من الخطوات البرهانية التي تتضمن الأسباب والتعبيرات الرياضية. يمكن إعادة صياغة البرهان بسهولة كسلسلة برهان تشترك في نفس التنسيقات مع سلسلة البرنامج الموثقة للمشكلات الحسابية. بشكل طبيعي، نقدم أيضًا إطار جيوفرمر (Geoformer) متعدد المهام والموحد للتعامل مع المشكلات الحسابية والبرهانية بشكل متزامن من خلال توليد السلسلة، والذي يظهر في النهاية أن قدرة الاستدلال يمكن تحسينها في كلتا المهمتين من خلال التوحيد الصيغوي. بالإضافة إلى ذلك، اقترحنا طريقة التعلم الأولي للتعبيرات الرياضية (MEP) التي تستهدف التنبؤ بالتعبيرات الرياضية في حل المشكلة، وبالتالي تحسين نموذج الجيوفرمر (Geoformer). أثبتت التجارب على UniGeo أن الجيوفرمر (Geoformer) المقترح لدينا حقق أفضل الأداء الحالي عن طريق تفوقه على نموذج NGS المحدد للمهمة بنسبة دقة تزيد عن 5.6% و3.2% لكل من المشكلات الحسابية والبرهانية على التوالي.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp