HyperAIHyperAI

Command Palette

Search for a command to run...

UI2CodeextN^ ext{N}extN: نموذج لغوي بصري لإنشاء التعليمات البرمجية التفاعلية من واجهة المستخدم قابلة للتوسع عند وقت الاختبار

Zhen Yang Wenyi Hong Mingde Xu Xinyue Fan Weihan Wang Jiele Cheng Xiaotao Gu Jie Tang

الملخص

برمجة واجهة المستخدم (UI) تمثل جزءًا أساسيًا لكنه معقدًا للغاية في تطوير البرمجيات الحديثة. تُظهر التطورات الأخيرة في نماذج اللغة البصرية (VLMs) إمكانات البرمجة التلقائية لواجهة المستخدم، لكن الطرق الحالية تواجه قيودًا رئيسية: تظل القدرات متعددة الوسائط غير متطورة بشكل كافٍ، كما أن النماذج أحادية الدور لا تستفيد بشكل فعّال من التغذية الراجعة البصرية التكرارية. نعالج هذه التحديات من خلال نموذج تفاعلي لتحويل واجهة المستخدم إلى كود، يعكس بفعالية أكبر سير العمل في العالم الحقيقي، ويرفع الحد الأقصى للأداء الممكن تحقيقه. ضمن هذا النموذج، نقدّم نموذج UI2CodeextN^ ext{N}extN، وهو نموذج لغة بصرية تم تدريبه عبر مراحل متعددة من التدريب المسبق، والضبط الدقيق، والتعلم بالتحفيز، بهدف تحقيق تحسينات أساسية في البرمجة متعددة الوسائط. يُوحّد النموذج ثلاث قدرات رئيسية: إنشاء الكود من واجهة المستخدم، وتحرير واجهة المستخدم، وتحسين واجهة المستخدم. كما نستكشف تقنيات التوسع في وقت الاختبار لدعم التوليد التفاعلي، مما يمكّن من الاستفادة المنظمة من التغذية الراجعة متعددة الدورات. أظهرت التجارب على معايير تحويل واجهة المستخدم إلى كود وتحسين واجهة المستخدم أن نموذج UI2CodeextN^ ext{N}extN يُحدث حالة جديدة من الأداء بين النماذج المفتوحة المصدر، ويحقق أداءً يُقارن بأفضل النماذج المغلقة مثل Claude-4-Sonnet وGPT-5. يمكن الوصول إلى الكود والنماذج الخاصة بنا عبر الرابط: https://github.com/zai-org/UI2Code_N.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
UI2Code$^ ext{N}$: نموذج لغوي بصري لإنشاء التعليمات البرمجية التفاعلية من واجهة المستخدم قابلة للتوسع عند وقت الاختبار | مستندات | HyperAI