HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 8 أيام

من التصفية إلى التحسين: إطار تصحيح لنموذج التشتت البصري-اللغوي

Yatai Ji Teng Wang Yuying Ge Zhiheng Liu Sidi Yang Ying Shan Ping Luo

من التصفية إلى التحسين: إطار تصحيح لنموذج التشتت البصري-اللغوي

الملخص

أصبحت نماذج الت(diffusion) المنفصلة اتجاهًا واعدًا في المهام المرتبطة بالرؤية واللغة، حيث تُقدِّم نمذجة سياقية ثنائية الاتجاه وتمكُّن من التوازي النظري. ومع ذلك، يُعَرَّض تطبيقها العملي لعوائق جسيمة بسبب الفجوة بين التدريب والاستدلال، التي تؤدي إلى تراكم أخطاء كارثية: فالأخطاء الأولية في الترميز أثناء عملية التفكيك المتوازِي تُلوِّث سياق التوليد، ما يُشَكِّل تفاعلًا سلسلة من الأخطاء المتراكمة، ويؤدي إلى أخطاء نحوية ووهميات معنوية. ولحل هذا التحدي الجوهري، نعيد صياغة عملية التوليد من تفتيت سلبي إلى تحسين نشط. نقدِّم "ReDiff"، وهي إطار تحسيني مُعزَّز بالـ(diffusion)، يُعلِّم النموذج على التعرف على أخطائه وتصحيحها بنفسه. يتميز نهجنا بعملية تدريب مزدوجة: أولاً، نُضَيِّف قدرة أساسية على المراجعة من خلال تدريب النموذج على تصحيح أخطاء مُصَنَّعة؛ ثانياً، نُطبِّق دورة تصحيح ذاتي جديدة في الوقت الفعلي، حيث يُدرَّب النموذج صراحةً على مراجعة مسوداته الخاطئة من خلال تعلُّم التصحيحات التي يُقدِّمها خبير. يُزوِّد هذا التعلُّم القائم على الأخطاء النموذج بالقدرة الحاسمة على إعادة النظر في مخرجاته المُولَّدة مسبقًا وتحسينها، مما يُعَطِّل بفعالية تراكم الأخطاء. تُظهر التجارب الواسعة أن ReDiff تُحسِّن بشكل ملحوظ اتساق المحتوى المُولَّد ودقة معلوماته الحقيقية، ما يُمكِّن من توليد متوازٍ مستقر وفعّال، يفوق بكثير الطرق التقليدية لتفتيت الضوضاء. تُتاح أكوادنا ونماذجنا عبر الرابط: https://rediff-hku.github.io/.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
من التصفية إلى التحسين: إطار تصحيح لنموذج التشتت البصري-اللغوي | الأوراق البحثية | HyperAI