HyperAIHyperAI

Command Palette

Search for a command to run...

منذ شهر واحد

تركيب صور هندسية قابلة للتطبيق بشكل عام

Yue Xin Wenyuan Wang Rui Pan Ruida Wang Howard Meng et al

تركيب صور هندسية قابلة للتطبيق بشكل عام

الملخص

تُعد النماذج اللغوية الكبيرة متعددة الوسائط ذات تطبيقات عملية متنوعة تتطلب قدرات استدلالية قوية. وعلى الرغم من التقدم الأخير، تظل هذه النماذج تواجه صعوبات في حل المشكلات الهندسية المعقدة. وتنبع المشكلة الأساسية من نقص مجموعات بيانات عالية الجودة تتكون من أزواج صور-نصوص تُستخدم لفهم الصور الهندسية. علاوةً على ذلك، غالبًا ما تفشل معظم خطوط أنابيب توليد البيانات القائمة على القوالب في التعميم على الأسئلة التي تتجاوز القوالب المحددة مسبقًا. في هذه الورقة، نُغطي هذا الفجوة من خلال دمج عملية مكملة تُعرف بـ "التعلم بالتعزيز مع مكافآت قابلة للتحقق" (RLVR) في خط أنابيب توليد البيانات. وباستخدام RLVR لتحسين الوصف النصي للصور الهندسية التي تم توليدُها من 50 علاقة هندسية أساسية، مع استخلاص إشارات المكافأة من مهام حل المسائل الرياضية، نُحقق نجاحًا في التقاط الخصائص الأساسية لحل المشكلات الهندسية. هذا يُمكّن من تحسين التعميم على المهام، ويؤدي إلى تحسينات ذات معنى. علاوةً على ذلك، حتى في السيناريوهات التي تخرج عن التوزيع التدريبي (out-of-distribution)، يُعزز المجموعة المُولَّدة القدرة الاستدلالية العامة للنماذج اللغوية الكبيرة متعددة الوسائط، حيث تُسجّل تحسينات في الدقة تتراوح بين 2.8% إلى 4.8% في المهام الإحصائية، والحسابية، والجبرية، والعددية، باستخدام صور غير هندسية من مجموعتي بيانات MathVista وMathVerse، بالإضافة إلى تحسينات تتراوح بين 2.4% إلى 3.9% في المهام الفنية والتصميمية والتقنية والهندسية ضمن مجموعة بيانات MMMU.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تركيب صور هندسية قابلة للتطبيق بشكل عام | الأوراق البحثية | HyperAI