HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 9 أيام

UI2Code$^ ext{N}$: نموذج لغوي بصري لإنشاء التعليمات البرمجية التفاعلية من واجهة المستخدم قابلة للتوسع عند وقت الاختبار

Zhen Yang Wenyi Hong Mingde Xu Xinyue Fan Weihan Wang Jiele Cheng Xiaotao Gu Jie Tang

UI2Code$^   ext{N}$: نموذج لغوي بصري لإنشاء التعليمات البرمجية التفاعلية من واجهة المستخدم قابلة للتوسع عند وقت الاختبار

الملخص

برمجة واجهة المستخدم (UI) تمثل جزءًا أساسيًا لكنه معقدًا للغاية في تطوير البرمجيات الحديثة. تُظهر التطورات الأخيرة في نماذج اللغة البصرية (VLMs) إمكانات البرمجة التلقائية لواجهة المستخدم، لكن الطرق الحالية تواجه قيودًا رئيسية: تظل القدرات متعددة الوسائط غير متطورة بشكل كافٍ، كما أن النماذج أحادية الدور لا تستفيد بشكل فعّال من التغذية الراجعة البصرية التكرارية. نعالج هذه التحديات من خلال نموذج تفاعلي لتحويل واجهة المستخدم إلى كود، يعكس بفعالية أكبر سير العمل في العالم الحقيقي، ويرفع الحد الأقصى للأداء الممكن تحقيقه. ضمن هذا النموذج، نقدّم نموذج UI2CodeextN^ ext{N}extN، وهو نموذج لغة بصرية تم تدريبه عبر مراحل متعددة من التدريب المسبق، والضبط الدقيق، والتعلم بالتحفيز، بهدف تحقيق تحسينات أساسية في البرمجة متعددة الوسائط. يُوحّد النموذج ثلاث قدرات رئيسية: إنشاء الكود من واجهة المستخدم، وتحرير واجهة المستخدم، وتحسين واجهة المستخدم. كما نستكشف تقنيات التوسع في وقت الاختبار لدعم التوليد التفاعلي، مما يمكّن من الاستفادة المنظمة من التغذية الراجعة متعددة الدورات. أظهرت التجارب على معايير تحويل واجهة المستخدم إلى كود وتحسين واجهة المستخدم أن نموذج UI2CodeextN^ ext{N}extN يُحدث حالة جديدة من الأداء بين النماذج المفتوحة المصدر، ويحقق أداءً يُقارن بأفضل النماذج المغلقة مثل Claude-4-Sonnet وGPT-5. يمكن الوصول إلى الكود والنماذج الخاصة بنا عبر الرابط: https://github.com/zai-org/UI2Code_N.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
UI2Code$^ ext{N}$: نموذج لغوي بصري لإنشاء التعليمات البرمجية التفاعلية من واجهة المستخدم قابلة للتوسع عند وقت الاختبار | الأوراق البحثية | HyperAI