HyperAIHyperAI

Command Palette

Search for a command to run...

T-LoRA: تخصيص نموذج التشتت لصورة واحدة دون الإفراط في التكيف

Vera Soboleva Aibek Alanov Andrey Kuznetsov Konstantin Sobolev

الملخص

بينما تقدم تقنيات التعديل الدقيق للنماذج التفاضلية نهجًا قويًا لتهيئة النماذج المدربة مسبقًا لإنتاج أشياء محددة، فإنها غالبًا ما تعاني من الإفراط في التكيف عند حدوث نقص في عينات التدريب، مما يقوض قدرتها على التعميم وتنوع الإخراج. يتناول هذا البحث مهمة صعبة ومع ذلك ذات تأثير كبير وهي تكييف نموذج تفاضلي باستخدام صورة واحدة فقط للمفهوم، حيث تعتبر التهيئة بناءً على صورة واحدة الأكثر إمكانية عملية. نقدم T-LoRA، وهو إطار للتعديل الدقيق ذو الرتبة المنخفضة المعتمد على الزمن (Timestep-Dependent Low-Rank Adaptation) والمصمم خصيصًا لشخصنة النماذج التفاضلية. في دراستنا، نوضح أن خطوات التفاضل الأعلى أكثر عرضة للإفراط في التكيف مقارنة بخطوات التفاضل الأدنى، مما يتطلب استراتيجية تعديل دقيقة زمنيًا. يدمج T-LoRA ابتكارين رئيسيين: (1) استراتيجية تعديل ديناميكية تقوم بضبط تحديثات مقيدة بالرتبة بناءً على خطوات التفاضل، و(2) تقنية معامل الوزن التي تضمن الاستقلال بين مكونات المعدل من خلال المبادرة بالمصفوفات المتعامدة. تظهر التجارب الواسعة أن T-LoRA ومكوناتها الفردية تتفوق على LoRA القياسية وتقنيات شخصنة النماذج التفاضلية الأخرى. فهي تحقق توازنًا أفضل بين دقة المفهوم والتوافق مع النص، مما يسلط الضوء على إمكانات T-LoRA في السيناريوهات ذات البيانات المحدودة والموارد المقيدة. يمكن الوصول إلى الكود عبر الرابط https://github.com/ControlGenAI/T-LoRA.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
T-LoRA: تخصيص نموذج التشتت لصورة واحدة دون الإفراط في التكيف | مستندات | HyperAI